PythonのPandasライブラリは、データ分析に非常に便利なツールです。特に、DataFrame.query
メソッドを使用すると、データフレーム内の特定の値を簡単に抽出できます。この記事では、リスト内の値に基づいてデータフレームからデータをクエリする方法について説明します。
データフレームの準備
まず、クエリを実行するためのサンプルデータフレームを作成します。
import pandas as pd
import numpy as np
df = pd.DataFrame({
'a': range(1, 6),
'b': range(10, 0, -2),
'c c' : [1, 3, 5, 7, 9],
'd' : [2, np.nan, np.inf, None, 10],
'e' : ['a', 'b', 'c', 'd', 'e'],
'f' : [False, True, True, False, True]
})
リストを使用した条件抽出
次に、リスト内の値に基づいてデータフレームからデータを抽出します。以下の例では、’a’列の値がリスト(1, 2, 3)
のいずれかである行を抽出します。
df.query('a in (1, 2, 3)')
また、変数を使用して条件抽出を行うことも可能です。以下の例では、変数x
に格納された値を使用しています。
x = 2
df.query('a == @x')
以上が、PythonとPandasを使ってデータフレームからリストに基づいてデータをクエリする基本的な方法です。これらのテクニックを使えば、大量のデータから必要な情報を効率的に抽出することができます。.