Pythonでは、文字列の部分一致を置換するためにreplace()
メソッドを使用します。しかし、このメソッドだけでは部分一致の置換が難しい場合があります。そのような場合、regex=True
を引数に追加して正規表現検索を使用すると、部分一致の置換が可能になります。
以下に、部分一致の文字列を置換するためのPythonコードの例を示します。
import pandas as pd
df = pd.DataFrame({
'x': ['カレーライス', 'ピラフ; チャーハン', 'チャーハン', 'ハンバーグ; 餃子', '餃子', 'そば; 玉丼', 'うどん']
})
words = ["チャーハン","餃子"]
for w in words:
df["x"] = df["x"].replace(w, "その他", regex=True)
print(df)
このコードでは、replace()
メソッドの引数にregex=True
を追加することで、部分一致の文字列(ここでは”チャーハン”と”餃子”)を別の文字列(ここでは”その他”)に置換しています。
このように、Pythonのreplace()
メソッドと正規表現を組み合わせることで、部分一致の文字列の置換を行うことができます。これは、データの前処理やテキストのクリーニングなど、様々な場面で役立つテクニックです。