Pythonのデータ分析ライブラリであるPandasには、データフレームをフィルタリングするための便利なメソッドがあります。この記事では、その使い方を詳しく解説します。
DataFrame.filterの基本
DataFrame.filter
は、データフレームの行または列を指定したインデックスラベルに基づいてフィルタリングします。このメソッドは、データフレームの内容に基づいてフィルタリングするのではなく、インデックスのラベルに対してフィルタリングを適用します。
filterのパラメータ
DataFrame.filter
メソッドには以下のパラメータがあります。
items
: 軸から保持するラベル。itemsに指定したラベルを持つ行または列を保持します。like
: ラベルに”like”が含まれている場合、そのラベルを持つ行または列を保持します。regex
: 正規表現。re.search(regex, label) == True
となるラベルを持つ行または列を保持します。axis
: フィルタリングを適用する軸。{0または’index’, 1または’columns’, None}のいずれかを指定します。デフォルトはNoneです。
filterの使用例
以下に、DataFrame.filter
の使用例を示します。
import pandas as pd
# データフレームの作成
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
})
# 'A'列と'B'列を保持
df_filtered = df.filter(items=['A', 'B'])
print(df_filtered)
このコードを実行すると、以下のような出力が得られます。
A B
0 1 4
1 2 5
2 3 6
以上、PythonとPandasを使ったデータフレームのフィルタリングについて解説しました。この機能を活用することで、データ分析の効率を大いに向上させることができます。ぜひ試してみてください。