Pythonは文字列の結合、切り出し、置換、正規表現による検索や後方参照などをサポートしています。特に、文字列の置換と後方参照は、データの整形やパターンマッチングなど、多くの場面で役立ちます。
文字列の置換
Pythonでは、文字列の置換を行うためにreplace
メソッドを使用します。以下に一例を示します。
dna = 'AGACXGTAXCGXTA'
dna_mod = dna.replace('X', 'C')
print(dna_mod) # 'AGACCGTACCGCTA'
この例では、文字列dna
の中のX
をC
に置換しています。
後方参照
後方参照は、正規表現を利用してパターンマッチングを行い、その後方参照を行う場合に使用します。具体的な例を以下に示します。
import re
dna = 'AAAAXAAACCCXCCCAAXAGGGTTTT'
pattern = re.compile("AXA")
dna_mod = pattern.sub('CCC', dna)
print(dna_mod) # 'AAACCCAACCCXCCCACCCGGGTTTT'
この例では、AXA
というパターンをCCC
に置換しています。ここで、re.compile
は正規表現パターンをコンパイルするための関数で、sub
メソッドは置換を行います。
以上がPythonでの文字列の置換と後方参照の基本的な使い方です。これらの機能を理解し活用することで、より複雑な文字列操作を行うことが可能になります。