Pythonでは、reモジュールを使って正規表現を扱います。このモジュールをインポートすることで、正規表現を使用して文字列の検索、置換、分割などを行うことができます。
import re
正規表現の基本的なパターンには、文字列のパターンを表現するための記法があります。以下にいくつかの基本的なパターンを示します。
\\d:任意の数字 [0-9]\\D:任意の数字以外 [^0-9]\\s:任意の空白文字 [\t\n\r\f\v]\\S:任意の空白文字以外 [^\t\n\r\f\v]\\w:任意の英数字 [a-zA-Z0-9_]\\W:任意の英数字以外 [^a-zA-Z0-9_]\\A:文字列の先頭\\Z:文字列の末尾.:任意の一文字^:文字列の先頭$:文字列の末尾*:0回以上の繰り返し+:1回以上の繰り返し?:0回または1回{m}:m回の繰り返し{m,n}:m〜n回の繰り返し[]:集合|:和集合(または)():グループ化
以下に、正規表現を使った文字列の検索と置換の基本的な例を示します。
import re
# 文字列の検索
content = 'hellow python, 123, end.'
pattern = 'hel'
result = re.match(pattern, content)
if result:
print(result.group()) # output: hel
# 文字列の置換
content = 'hellow python, 123, end.'
pattern = 'hel'
replacement = 'HEL'
result = re.sub(pattern, replacement, content)
print(result) # output: HELlow python, 123, end.
以上がPythonと正規表現を用いた文字列操作の基本です。これらの基本を理解し、適切に応用することで、より複雑な文字列操作を行うことが可能になります。