Pythonのデータ分析ライブラリであるPandasを使用して、リストの要素をグループ化し、それぞれのグループのカウントを行う方法について説明します。
Pandasのgroupby関数の基本的な使い方
Pandasのgroupby
関数は、同じグループのデータをまとめて、任意の関数(合計・平均など)を実行したい時に使用します。以下に、groupby
関数の基本的な使い方を示します。
# Pandasライブラリをインポート
import pandas as pd
# データフレームを作成
df = pd.DataFrame({
'商品名': ['りんご', 'りんご', 'ぶどう', 'ぶどう', 'りんご'],
'販売数量': [100, 120, 80, 100, 90]
})
# 商品名ごとに販売数量を合計
df_grouped = df.groupby('商品名').sum()
print(df_grouped)
このコードを実行すると、商品名ごとに販売数量が合計された結果が出力されます。
Pandasのgroupby関数でデータの個数を算出
groupby
関数とcount
関数を組み合わせることで、各グループのデータの個数を算出することができます。
# 商品名ごとにデータの個数を算出
df_count = df.groupby('商品名').count()
print(df_count)
このコードを実行すると、商品名ごとにデータの個数が算出されます。
以上が、PythonのPandasライブラリを使用して、リストの要素をグループ化し、それぞれのグループのカウントを行う基本的な方法です。データ分析でよく使うテクニックなので、ぜひ参考にしてみてください。