Pythonのデータ分析ライブラリであるpandasのDataFrameでは、query()
メソッドを使用して複数の条件を指定したデータ抽出が可能です。以下にその使用例を示します。
import pandas as pd
import numpy as np
# 乱数のデータフレームを作成
df = pd.DataFrame(np.random.randn(20, 2), columns=list('ab'))
# a列が0より大きいデータを抽出
df_a_gt_0 = df.query("a > 0")
# a列が0より大きく、かつb列が0より大きいデータを抽出
df_a_b_gt_0 = df.query("a > 0 & b > 0")
上記のコードでは、まず乱数を元にしたデータフレームを作成しています。その後、query()
メソッドを使用して、a列の値が0より大きいデータ、そしてa列とb列の値が共に0より大きいデータを抽出しています。
複数の条件を指定する際は、&
(AND)や|
(OR)などの論理演算子を使用します。このように、query()
メソッドを使用すると、複数の条件を指定したデータ抽出が簡単に行え、コードの可読性も高まります。
以上がPythonのpandasライブラリのDataFrameで複数条件を用いたクエリの実行方法になります。この機能を活用して、データ分析をより効率的に行ってみてください。.