Pythonでは、文字列の一部を置換するためにはreplace()
メソッドを使用します。しかし、このメソッドはデフォルトでは完全一致のみを対象とします。
部分一致で文字列を置換するためには、replace()
メソッドの引数にregex=True
を追加して正規表現検索を使うと可能になります。
以下に具体的なコードを示します。
import pandas as pd
# データフレームの作成
df = pd.DataFrame({
'x': ['カレーライス', 'ピラフ; チャーハン', 'チャーハン', 'ハンバーグ; 餃子', '餃子', 'そば; 玉丼', 'うどん']
})
# 置換したい単語のリスト
words = ["チャーハン","餃子"]
# 単語リスト内の各単語を「その他」に置換
for w in words:
df["x"] = df["x"].replace(w, "その他", regex=True)
print(df)
このコードでは、データフレームdf
のx
列に含まれるwords
リストの各単語を「その他」に置換しています。
このように、Pythonのreplace()
メソッドと正規表現を組み合わせることで、文字列の一部を効率的に置換することができます。