Pythonのデータ分析ライブラリであるPandasは、データフレームという2次元の表形式のデータ構造を提供しています。この記事では、特定の文字列を含む行や列をデータフレームから抽出する方法について説明します。
Pandasデータフレームの作成
まずは、以下のようなデータフレームを作成します。
import pandas as pd
df = pd.DataFrame({
"col_A": ["dataA_1", "dataA_2", "dataA_3", "dataA_4"],
"col_B": ["dataB_1", "dataB_2", "dataB_3", "dataB_4"]
})
特定の文字列を含む行の抽出
特定の文字列を含む行を抽出するには、str.contains()
メソッドを使用します。例えば、col_A
にA_1
を含む行を抽出するには、以下のようにします。
df[df['col_A'].str.contains('A_1')]
特定の文字列を含まない行の抽出
一方、特定の文字列を含まない行を抽出するには、~
を使用します。例えば、col_A
にA_1
を含まない行を抽出するには、以下のようにします。
df[~df['col_A'].str.contains('A_1')]
以上がPythonとPandasを使用したデータフレーム操作の基本的な方法です。これらのテクニックを使うことで、データ分析の幅が広がります。.