Pythonのre
モジュールは、Perlと同様の正規表現マッチング操作を提供します。この記事では、特にアルファベット文字のマッチングに焦点を当てます。
アルファベット文字のマッチング
アルファベット文字をマッチさせるためには、正規表現のパターンとして[^\\W\\d_]
を使用します。ここで、\\W
はアルファベット文字、数字、アンダースコア以外の文字を、\\d
は数字を、_
はアンダースコアを表します。したがって、[^\\W\\d_]
はこれら以外の文字、つまりアルファベット文字をマッチさせます。
以下に、Pythonでの使用例を示します。
import re
rx = re.compile("[^\\W\\d_]+", re.UNICODE)
print(rx.findall(u"abc_def,k9")) # Output: [u'abc', u'def', u'k']
この例では、Unicode文字列u"abc_def,k9"
からアルファベット文字を抽出しています。
注意点
Pythonのre
モジュールは、Unicode文字列と8ビット文字列を混在させることはできません。つまり、Unicode文字列を8ビットパターンでマッチさせることや、その逆はできません。また、置換を求める際には、置換文字列はパターンと検索文字列と同じ型でなければなりません。
以上、Pythonのre
モジュールを用いてアルファベット文字をマッチさせる方法について説明しました。この情報がPythonでの正規表現の使用に役立つことを願っています。