PythonでUTF-8エンコーディングのテキストファイルを読み込む方法はいくつかあります。ここでは、その中でも一般的な方法をいくつか紹介します。
open
関数を使用する
Pythonの組み込み関数open
を使用してファイルを開き、read
メソッドで内容を読み込むことができます。このとき、open
関数のencoding
引数に'utf-8'
を指定することで、UTF-8エンコーディングのテキストファイルを正しく読み込むことができます。
with open('utf-8.txt', mode='r', encoding='utf-8') as f:
text = f.read()
このコードは、utf-8.txt
という名前のUTF-8エンコーディングのテキストファイルを開き、その内容を変数text
に読み込みます。
io
モジュールを使用する
Python 2.6以降、io
モジュールが追加され、io.open
関数が利用可能になりました。この関数もencoding
引数を受け取ることができ、同様にUTF-8エンコーディングのテキストファイルを読み込むことができます。
import io
with io.open('utf-8.txt', mode='r', encoding='utf-8') as f:
text = f.read()
このコードも、utf-8.txt
という名前のUTF-8エンコーディングのテキストファイルを開き、その内容を変数text
に読み込みます。
以上、PythonでUTF-8エンコーディングのテキストファイルを読み込む基本的な方法を紹介しました。これらの方法を使えば、さまざまなエンコーディングのテキストファイルを適切に扱うことができます。