Pythonのpandasライブラリには、データフレームから特定の行を抽出するためのquery
メソッドがあります。このメソッドは、条件を指定することで、その条件を満たす行を抽出することができます。
以下に、いくつかの使用例を示します。
# price列が337の行を抽出
df.query("price == 337")
# depth列が62以上の行を抽出
df.query("depth >= 62")
# carat列が0.23~0.27の行を抽出
df.query("0.23 <= carat <= 0.27")
# color列がEの行を抽出
df.query("color == 'E'")
# color列がE以外の行を抽出
df.query("color != 'E'")
# color列がIまたはJの行を抽出
df.query("color in ['I', 'J']")
# depth列が62以上かつcolor列がHの行を抽出(AND)
df.query("depth >= 62 & color == 'H'")
# depth列が62以上またはcolor列がHの行を抽出(OR)
df.query("depth >= 62 | color == 'H'")
# (depth列が62以上かつcolor列がH)ではない行を抽出(NOT)
df.query("~ (depth >= 62 & color == 'H')")
# price列が337の行を抽出 (変数を使用)
x = 337
df.query("price == @x")
これらの例を参考に、自分のデータ分析に活用してみてください。query
メソッドは、複雑な条件を指定してデータを抽出する際に非常に便利なツールです。ただし、大規模なデータセットを扱う際には、パフォーマンスの問題に注意する必要があります。.