Pythonは標準でUTF-8が採用されています。これは、Pythonが世界中で使われている文字を表現できるようにするための重要な特性です。
PythonでUTF-8文字列を出力する基本的な方法は、print()
関数を使用し、UTF-8文字列を引数として渡すことです。しかし、環境によってはエラーが発生する場合もあります。特に、WindowsとMacでは採用されている文字コードが異なるため、OSが変わるとエラーが発生する場面も増えます。
以下に、PythonでUTF-8の文字列を出力する一例を示します。
print('こんにちは')
このコードは、UTF-8でエンコードされた文字列 “こんにちは” を出力します。
しかし、Shift-JISで書かれたコードを実行しようとすると、Pythonの標準ではUTF-8が採用されているので、エラーが出てしまいます。これを防ぐためには、基本的にUTF-8でプログラムを書き、エンコーディング方式をプログラムの先頭に書くことが一般的です。
以下に、PythonでUTF-8の文字列を出力するためのエンコーディング指定の例を示します。
# coding: utf-8
print('こんにちは')
このコードは、UTF-8でエンコードされた文字列 “こんにちは” を出力します。プログラムの最初に # coding: utf-8
を追加することで、エンコーディングを指定しています。
以上が、PythonでUTF-8の文字列を出力する基本的な方法とその注意点です。Pythonを使って多言語対応のプログラムを書く際には、これらの知識が役立つでしょう。