\

Pythonのデータ分析ライブラリであるPandasは、データフレーム(DataFrame)という2次元のデータ構造を提供しています。このデータフレームは、SQLのようなクエリを実行するための機能を持っています。

Pandasのsum関数とqueryメソッド

Pandasのsum関数は、指定した列の合計値を計算します。また、queryメソッドは、指定した条件に一致するデータを抽出します。これらを組み合わせることで、特定の条件を満たすデータの合計値を求めることができます。

# データフレームの作成
import pandas as pd
df = pd.DataFrame({
    '商品名': ['りんご', 'みかん', 'ぶどう', 'りんご', 'みかん'],
    '販売数量': [10, 20, 30, 40, 50]
})

# 'りんご'の販売数量の合計を求める
total = df.query("商品名 == 'りんご'")['販売数量'].sum()
print(total)  # 50

上記のコードでは、まずqueryメソッドを使って’りんご’のデータを抽出し、その後sum関数を使って販売数量の合計を計算しています。

複数条件の指定

queryメソッドでは、複数の条件を指定することも可能です。以下の例では、’りんご’で販売数量が10以上のデータの合計を求めています。

# 'りんご'で販売数量が10以上のデータの合計を求める
total = df.query("商品名 == 'りんご' and 販売数量 >= 10")['販売数量'].sum()
print(total)  # 50

このように、Pandasのsum関数とqueryメソッドを使うと、複雑な条件を指定したデータの合計値を簡単に求めることができます。これは、データ分析や前処理において非常に便利な機能です。ぜひ活用してみてください。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です