Pythonのデータ分析ライブラリであるPandasは、データフレーム(DataFrame)という2次元のデータ構造を提供しています。このデータフレームは、SQLのようなクエリを実行するための機能を持っています。
Pandasのsum関数とqueryメソッド
Pandasのsum
関数は、指定した列の合計値を計算します。また、query
メソッドは、指定した条件に一致するデータを抽出します。これらを組み合わせることで、特定の条件を満たすデータの合計値を求めることができます。
# データフレームの作成
import pandas as pd
df = pd.DataFrame({
'商品名': ['りんご', 'みかん', 'ぶどう', 'りんご', 'みかん'],
'販売数量': [10, 20, 30, 40, 50]
})
# 'りんご'の販売数量の合計を求める
total = df.query("商品名 == 'りんご'")['販売数量'].sum()
print(total) # 50
上記のコードでは、まずquery
メソッドを使って’りんご’のデータを抽出し、その後sum
関数を使って販売数量の合計を計算しています。
複数条件の指定
query
メソッドでは、複数の条件を指定することも可能です。以下の例では、’りんご’で販売数量が10以上のデータの合計を求めています。
# 'りんご'で販売数量が10以上のデータの合計を求める
total = df.query("商品名 == 'りんご' and 販売数量 >= 10")['販売数量'].sum()
print(total) # 50
このように、Pandasのsum
関数とquery
メソッドを使うと、複雑な条件を指定したデータの合計値を簡単に求めることができます。これは、データ分析や前処理において非常に便利な機能です。ぜひ活用してみてください。.