\

Pythonのデータ分析ライブラリであるPandasには、データフレームをフィルタリングするための便利なメソッドがあります。この記事では、その使い方を詳しく解説します。

DataFrame.filterの基本

DataFrame.filterは、データフレームの行または列を指定したインデックスラベルに基づいてフィルタリングします。このメソッドは、データフレームの内容に基づいてフィルタリングするのではなく、インデックスのラベルに対してフィルタリングを適用します。

filterのパラメータ

DataFrame.filterメソッドには以下のパラメータがあります。

  • items: 軸から保持するラベル。itemsに指定したラベルを持つ行または列を保持します。
  • like: ラベルに”like”が含まれている場合、そのラベルを持つ行または列を保持します。
  • regex: 正規表現。re.search(regex, label) == Trueとなるラベルを持つ行または列を保持します。
  • axis: フィルタリングを適用する軸。{0または’index’, 1または’columns’, None}のいずれかを指定します。デフォルトはNoneです。

filterの使用例

以下に、DataFrame.filterの使用例を示します。

import pandas as pd

# データフレームの作成
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
})

# 'A'列と'B'列を保持
df_filtered = df.filter(items=['A', 'B'])

print(df_filtered)

このコードを実行すると、以下のような出力が得られます。

   A  B
0  1  4
1  2  5
2  3  6

以上、PythonとPandasを使ったデータフレームのフィルタリングについて解説しました。この機能を活用することで、データ分析の効率を大いに向上させることができます。ぜひ試してみてください。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です