\

Pythonでは、文字列とバイト列(文字コード)を相互に変換するためのメソッドが提供されています。これらのメソッドを使うことで、「文字列がどんなバイト列か?」、具体的な値を確認できます。

encodeメソッド

encodeメソッドは、文字列をバイト列に変換します。このプロセスをエンコード(Encode:符号化)と言います。

'文字列'.encode('文字コード名')

decodeメソッド

decodeメソッドは、バイト列を文字列に戻します。このプロセスをデコード(Decode:復号化)と言います。

b'バイト列'.decode('文字コード名')

実例

以下に、UTF-8とShift_JISのバイト列への変換と、その逆変換の例を示します。

UTF-8のバイト列への変換

'あ'.encode('utf-8')  # 実行結果: b'\xe3\x81\x82'

Shift_JISのバイト列への変換

'あ'.encode('shift_jis')  # 実行結果: b'\x82\xa0'

バイト列から文字列への変換

b'\xe3\x81\x82'.decode('utf-8')  # 実行結果: 'あ'
b'\x82\xa0'.decode('shift_jis')  # 実行結果: 'あ'
これらのメソッドを使うことで、Pythonで文字列とバイト列(文字コード)の変換が容易になります。これは特に、日本語などの非ASCII文字を扱う際に重要な知識となります。

エンジニア くま Blog.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です