PythonとOpenpyxlを使用してExcelの重複データを削除する方法を紹介します。
重複データの削除
以下のPythonコードを使用して、Excelの重複データを削除できます。このコードは、Excelのシート内の重複データをチェックし、該当する行を削除します。
import openpyxl
wb = openpyxl.load_workbook('C:/Users/xxx/Desktop/test/test.xlsx')
ws = wb['Sheet1']
for j in range(ws.max_row + 1):
if j == 0:
continue
list = ws.cell(j, 1).value
list_Num = j
for i in reversed(range(ws.max_row + 1)):
if i == 0:
break
if ws.cell(i, 1).value == list:
if i == j:
continue
else:
ws.delete_rows(i)
wb.save('C:/Users/xxx/Desktop/test/test重複削除.xlsx')
このコードは、指定したExcelファイルを開き、指定したシートの各行をループします。各行の値を取得し、その値が他の行に存在するかどうかをチェックします。同じ値が見つかった場合、その行は削除されます。
この方法を使用すると、大量のデータを含むExcelファイルの重複データを効率的に削除できます。PythonとOpenpyxlの力を利用して、データ処理作業を自動化しましょう。.