Pandasのpivot_tableとは
Pandasのpivot_table
関数は、データフレームをグループ化してピボットテーブルを作成するための強力なツールです。ピボットテーブルとは、大量のデータから様々な項目で集計ができる機能のことで、列データと行データのクロス集計により、一目でデータ構造を把握できます。
基本的な使い方
pivot_table関数の基本的な使い方は以下の通りです。
df_1=pd.pivot_table(df, index='日付', columns='商品名',values='販売数量',aggfunc='sum').astype(int)
このコードでは、pivot_table
関数の引数に「index」「columns」「values」「aggfunc」が指定されています。「aggfunc=’sum’」によって、それぞれの商品の販売数量を合計します。
応用的な使い方
pivot_table関数の応用的な使い方として、売上の平均を算出する方法があります。
df_2 = pd.pivot_table(df, index='日付', columns='商品名',values='売上',aggfunc='mean').astype(int)
このコードでは、「aggfunc=’mean’」に指定することで、それぞれの商品の売上平均を算出します。
以上がPythonとPandasのpivot_tableの基本的な使い方と応用的な使い方になります。これらの知識を活用して、データ分析をより効率的に行いましょう。.