Pythonでは、文字列をUTF-8に変換するためのいくつかの方法があります。以下にその一部を紹介します。
Python 2での変換
Python 2では、次のようにunicode
関数を使用して文字列をUnicodeに変換できます。
s = "Hello!"
u = unicode(s, "utf-8")
ここで、s
はバイト文字列で、u
はUnicode文字列です。
Python 3での変換
Python 3では、すべての文字列がUnicodeであるため、unicode
関数は存在しません。
文字列のエンコード
文字列をUTF-8にエンコードするには、encode
メソッドを使用します。
string = 'pythön!'
string_utf = string.encode()
print('The encoded version is:', string_utf)
このコードは、string
をUTF-8にエンコードし、結果を表示します。
以上がPythonでUnicode文字列をUTF-8に変換する基本的な方法です。適切な方法を選択することで、さまざまな状況で文字列のエンコーディングとデコーディングを効果的に行うことができます。