Pythonでは、文字コードを指定してテキストファイルに書き込むことができます。特に、codecs.open()
を使うことで、「EUC」や「UTF-8」などの文字コードを指定してファイルに書き込むことが可能です。
以下に、PythonでUnicode文字列を書き込む基本的なコードを示します。
# -*- coding: utf-8 -*-
import codecs
# ファイルを開く(書き込みモード)
f = codecs.open("data.txt","w","utf-8")
text = "test data"
f.write(text)
# ファイルを閉じる
f.close()
このコードは、「data.txt」という名前のファイルを開き、その中に「test data」という文字列を書き込みます。ファイルが存在しない場合は新たに生成され、既存のファイルがある場合はその内容が上書きされます。
また、Pythonの公式ドキュメンテーションには、Unicodeの仕様について詳しく説明されています。Pythonの文字列型はUnicode標準を使用して文字を表現し、Pythonプログラムはこれらの異なる可能性のあるすべての文字を扱うことができます。
以上がPythonでUnicodeを扱う基本的な方法です。これを基に、さまざまな文字コードを扱うプログラムを作成することができます。.