Pythonでは、文字列をバイトに変換するための組み込み関数が提供されています。この記事では、UTF-8エンコードされた文字列をバイトに変換する方法について説明します。
UTF-8文字列をバイトに変換する
PythonでUTF-8エンコードされた文字列をバイトに変換するには、encode
関数を使用します。以下にその使用例を示します。
# UTF-8エンコードされた文字列
utf8_string = "こんにちは、世界!"
# 文字列をバイトに変換
bytes_data = utf8_string.encode('utf-8')
print(bytes_data)
このコードを実行すると、次のような出力が得られます。
b'\xe3\x81\x93\xe3\x82\x93\xe3\x81\xab\xe3\x81\xa1\xe3\x81\xaf\xe3\x80\x81\xe3\x81\x9b\xe3\x81\x8b\xe3\x81\x84\xef\xbc\x81'
この出力は、UTF-8エンコードされた文字列がバイトに変換された結果です。
注意点
バイトに変換したデータを再び文字列に戻すには、decode
関数を使用します。ただし、デコードする際には元のエンコーディング(この場合は’utf-8’)を指定する必要があります。
# バイトをUTF-8エンコードされた文字列に変換
utf8_string = bytes_data.decode('utf-8')
print(utf8_string)
このコードを実行すると、元の文字列 “こんにちは、世界!” が得られます。
以上が、PythonでUTF-8エンコードされた文字列をバイトに変換する方法です。この機能は、ネットワーク通信やファイル操作など、さまざまな場面で役立ちます。