Pythonは、その強力なライブラリエコシステムのおかげで、データ分析に広く使用されています。その中でも、Excelファイルを操作するためのライブラリは非常に重要です。今回は、その中でもxlrd
というライブラリについて詳しく見ていきましょう。
xlrdとは
xlrd
は、Excelファイル(特に古い.xls形式)からデータと書式情報を読み取るためのライブラリです。ただし、このライブラリは.xlsファイル以外は読み取れないことに注意が必要です。新しいファイル形式を読み取る代替手段については、こちらをご覧ください。
xlrdの使用方法
以下に、xlrd
を使用してExcelファイルを読み込む基本的なコードを示します。
import xlrd
book = xlrd.open_workbook("myfile.xls")
print("The number of worksheets is {0}".format(book.nsheets))
print("Worksheet name(s): {0}".format(book.sheet_names()))
sh = book.sheet_by_index(0)
print("{0} {1} {2}".format(sh.name, sh.nrows, sh.ncols))
print("Cell D30 is {0}".format(sh.cell_value(rowx=29, colx=3)))
for rx in range(sh.nrows):
print(sh.row(rx))
このコードは、指定したExcelファイルを開き、ワークシートの数と名前を表示します。次に、最初のワークシートを選択し、その名前と行数、列数を表示します。最後に、D30セルの値と各行の内容を表示します。
注意点
xlrd
は、チャート、マクロ、画像、その他の埋め込みオブジェクト(埋め込みワークシートを含む)、VBAモジュール、数式(ただし、数式の計算結果は抽出されます)、コメント、ハイパーリンク、自動フィルター、高度なフィルター、ピボットテーブル、条件付き書式、データ検証などをサポートしていません。また、パスワードで保護されたファイルはサポートされておらず、このライブラリでは読み取ることができません。
以上がxlrd
ライブラリの基本的な使い方と注意点になります。Pythonを使用してExcelデータを操作する際には、このライブラリが非常に役立つことでしょう。