Pythonは標準でUTF-8が採用されています。これは、Pythonのプログラムを書く際に、特に日本語を扱う場合でも、文字コードを宣言することなく日本語を扱えるようになっています。
Pythonで文字コードを変換する方法について見てみましょう。Pythonの標準の文字コードはUTF-8です。また標準入出力(外部との情報のやりとり)もUTF-8の文字列で行われます。
文字列をバイト列に変換するには encode
メソッドを使用します。
'文字列'.encode('文字コード名')
逆に、バイト列を文字列に変換するには decode
メソッドを使用します。
b'バイト列'.decode('文字コード名')
これらのメソッドを使うことで、Pythonで文字コードを扱うことが可能になります。
また、Pythonを起動する時にコマンドラインオプションで -X utf8
を追加するか環境変数で PYTHONUTF8=1
を設定しておくとUTF-8 Modeが有効になります。
以上がPythonとUTF-8に関する基本的な情報です。これらの知識を持っておけば、Pythonで文字コードを扱う際に役立つでしょう。.