\

Pythonのデータ分析ライブラリであるpandasには、データフレームをクエリするための強力な機能があります。特に、query関数はデータフレームから特定の条件に一致する行を抽出するのに非常に便利です。

以下に、pandasのquery関数を使用したデータ抽出の例をいくつか紹介します。

import pandas as pd
import numpy as np

# データフレームの準備
df = pd.DataFrame({
    'a': range(1, 6),
    'b': range(10, 0, -2),
    'c c' : [1, 3, 5, 7, 9],
    'd' : [2, np.nan, np.inf, None, 10],
    'e' : ['a', 'b', 'c', 'd', 'e'],
    'f' : [False, True, True, False, True]
})

# a列の値が3である行を抽出
df.query('a == 3')

# a列の値が3でない行を抽出
df.query('a != 3')

# a列の値が3より大きい行を抽出
df.query('a > 3')

# a列の値がb列の値より大きい行を抽出
df.query('a > b')

# a列の値が(1, 2, 3)のいずれかである行を抽出
df.query('a in (1, 2, 3)')

以上のように、pandasのquery関数を使用すると、様々な条件でデータフレームからデータを抽出することが可能です。これにより、データ分析の際にデータの前処理を効率的に行うことができます。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です