Pythonのxlrd
ライブラリは、Excelファイル(.xls形式)からデータを読み取るためのライブラリです。このライブラリは、Excelの基本的な操作が可能で、Pythonの他のライブラリと組み合わせることで、Excelデータの集計や可視化などの応用的な操作も可能になります。
xlrdのインストール
まずは、xlrdをインストールします。以下のコマンドを実行します。
pip install xlrd
Excelファイルの読み込み
次に、Excelファイルを読み込みます。以下のコードを参考にしてください。
import xlrd
book = xlrd.open_workbook("myfile.xls")
print("The number of worksheets is {0}".format(book.nsheets))
print("Worksheet name(s): {0}".format(book.sheet_names()))
sh = book.sheet_by_index(0)
print("{0} {1} {2}".format(sh.name, sh.nrows, sh.ncols))
print("Cell D30 is {0}".format(sh.cell_value(rowx=29, colx=3)))
for rx in range(sh.nrows):
print(sh.row(rx))
このコードは、Excelファイルを開き、シートの数、シートの名前、各シートの行数と列数、特定のセルの値、そして各行のデータを表示します。
注意点
xlrd
は、.xls形式のExcelファイルのみをサポートしています。新しいファイル形式を読み取るための代替手段については、こちらをご覧ください。
また、以下のものはサポートされていませんが、安全かつ確実に無視されます:
– チャート
– マクロ
– 画像
– その他の埋め込みオブジェクト(埋め込みワークシートを含む)
– VBAモジュール
– 数式(ただし、数式の計算結果は抽出されます)
– コメント
– ハイパーリンク
– 自動フィルタ、高度なフィルタ、ピボットテーブル、条件付き書式、データ検証
パスワードで保護されたファイルはサポートされておらず、このライブラリでは読み取ることができません。
以上、Pythonとxlrdライブラリを活用したExcelデータの読み取りについての基本的なガイドでした。この情報が皆さんのデータ分析作業に役立つことを願っています。