PythonでExcelファイルを扱う際、特に大きなファイルを扱うときには、読み込み速度が問題になることがあります。特に、openpyxl
ライブラリを使用してExcelファイルを読み込むとき、一般的なセルのアクセス方法では処理速度が遅くなることがあります。
しかし、openpyxl
には、Excelファイルの読み込みを高速化するための方法があります。それは、iter_rows
メソッドを使用して、シートをまとめて読み込み、イテレータに対して処理を行う方法です。
以下に、この方法を使用したコードの例を示します。
import openpyxl
# ワークブックを読み込みます
workbook = openpyxl.load_workbook('hoge.xlsx', read_only=True)
# シートを取得します
sheet = workbook['Sheet1']
# iter_rowsを使用して、シートをまとめて読み込みます
for row in sheet.iter_rows(min_row=1, max_col=5, max_row=1000):
# 各行のデータを処理します
data = [cell.value for cell in row]
この方法を使用すると、大きなExcelファイルでも高速に読み込むことができます。ただし、この方法は読み取り専用モードで開いたワークブックに対してのみ使用できます。
以上の方法を試してみて、Pythonとopenpyxl
を使用したExcelファイルの読み込み速度が向上することを確認してみてください。.