Pythonで正規表現を使用する際、空白文字の扱いは重要な要素の一つです。空白文字はスペース、タブ、改行などを含みます。Pythonの正規表現では、これらの空白文字を表現するために\sという特殊文字が用意されています。
空白文字のマッチング
Pythonの正規表現では、半角スペースと全角スペースを区別することができます。半角スペースはそのままスペースを記述することでマッチさせることができますが、全角スペースをマッチさせたい場合は、特殊文字\sを使用します。
例えば、「あいう えお」(半角スペース)と「あいう えお」(全角スペース)の両方にマッチさせたい場合、以下のように指定します。
import re
pattern = re.compile('あいう\sえお')
この場合、「あいう えお」(半角スペース)と「あいう えお」(全角スペース)の両方にマッチします。
連続したスペースのマッチング
正規表現では、連続したスペースをマッチさせることも可能です。繰り返しの表現を活用することで、複数のスペースにマッチさせることができます。
例えば、スペースを2つ含む文章とマッチさせたい場合は、以下のように記述します。
import re
pattern = re.compile('あいうえお\s{2}かきくけこ')
文字列からスペースを削除
Pythonの正規表現を使用して、文字列からスペースを削除することも可能です。以下にその方法を示します。
import re
string1 = 'あ い う え お'
print(re.sub('\s', '', string1))
このコードは、文字列からすべてのスペースを削除します。
以上、Pythonと正規表現における空白文字の扱いについて説明しました。この知識を活用して、より効率的なコードを書くことができます。.