Pythonのライブラリであるopenpyxl
を用いて、Excelのデータから特定の条件を満たすデータを抽出する方法について解説します。
openpyxlとは
openpyxl
はPythonでExcelファイルを読み書きするためのライブラリです。このライブラリを使用することで、Excelの機能をPythonから操作することが可能になります。
条件抽出の基本
openpyxl
を用いてExcelのデータから特定の条件を満たすデータを抽出する基本的な手順は以下の通りです。
openpyxl
ライブラリをインポートします。openpyxl.load_workbook
関数を用いてExcelファイルを開きます。ws1.iter_rows()
を用いてセルをループします。if list in cell.value:
を用いて、セルに指定文字が含まれていたらその行を別シートに転記します。
以下に具体的なコードを示します。
import openpyxl
#エクセルファイルを開く
wb = openpyxl.load_workbook('C:/Users/admin/Desktop/テスト/test.xlsx')
#開いたファイルのシートを変数格納
ws1 = wb['Sheet1']
ws2 = wb['Sheet2']
#転記開始行
j = 2
#検索する文字指定
MyValue = ['クリア','つるつる']
#配列ループ
for list in MyValue:
#セルをループ
for row in ws1.iter_rows():
for cell in row:
#1列目だったら
if cell.col_idx == 1:
#セルに指定文字が含まれていたら
if list in cell.value:
#ws1 A~C列ループ
for i in range(1,4):
#ws1の該当行をコピー
copy = ws1.cell(row = cell.row, column = i).value
#ws2へ転記
ws2.cell(row = j, column = i, value = copy)
#ws2の転記行を更新
j += 1
#別名で保存
wb.save('C:/Users/admin/Desktop/テスト/test抽出.xlsx')
このコードは、ws1
のA列で「クリア」か「つるつる」を含む行を、ws2
へ転記します。
まとめ
Pythonのopenpyxl
ライブラリを用いることで、Excelのデータから特定の条件を満たすデータを抽出することが可能です。これにより、大量のデータから必要な情報だけを効率的に取り出すことができます。今後もPythonを活用したデータ分析の技術を学んでいきましょう。