PythonのPandasライブラリを使用してExcelファイルを読み込む方法について説明します。Pandasは、Excelファイル(拡張子:.xlsx、.xls)をDataFrameとして読み込むためのread_excel()
メソッドを提供しています。
Pandasとxlrdのインストール
まず、Pandasとxlrdというライブラリをインストールする必要があります。Pandasのread_excel()
メソッドは内部的にxlrdというライブラリを使用しています。xlrdはPythonでExcelファイル(.xlsx、.xls)を読み込むためのライブラリです。
$ pip install pandas xlrd
Excelファイルの読み込み
ExcelファイルのパスまたはURLを第一引数に指定します。複数のシートがある場合、Pandasは最初のシートだけをDataFrameとして読み込みます。
import pandas as pd
df = pd.read_excel('sample.xlsx')
print(df)
シートの指定
読み込むシートをsheet_name
引数で指定することができます。
df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)
print(df_sheet_index)
df_sheet_name = pd.read_excel('sample.xlsx', sheet_name='sheet2')
print(df_sheet_name)
複数のシートを読み込む
sheet_name
引数にリストを指定することで、複数のシートを読み込むことができます。
df_sheet_multi = pd.read_excel('sample.xlsx', sheet_name=[0, 'sheet2'])
print(df_sheet_multi)
すべてのシートを読み込む
sheet_name
引数がNoneの場合、すべてのシートが読み込まれます。
以上がPythonとPandasを使用してExcelファイルを読み込む基本的な方法です。これを基に、さらに詳細なデータ分析を行うことができます。.