PythonとPandasを使ってCSVファイルを読み込む際、文字コードがUTF-8やShift-JISである場合があります。この記事では、それぞれの文字コードをどのように扱うかについて説明します。
CSVファイルの読み込み
PythonのPandasライブラリを使ってCSVファイルを読み込む基本的なコードは以下の通りです。
import pandas as pd
df = pd.read_csv("file/to/path")
しかし、このコードはCSVファイルの文字コードがUTF-8であることを前提としています。もしCSVファイルの文字コードがShift-JISである場合、UnicodeDecodeError
が発生する可能性があります。
Shift-JISのCSVファイルの読み込み
Shift-JISのCSVファイルを読み込むには、read_csv
関数のencoding
引数に"shift-jis"
を指定します。
df = pd.read_csv("file/to/path", encoding="shift-jis")
このコードにより、Shift-JISのCSVファイルも問題なく読み込むことができます。
まとめ
PythonとPandasを使ってCSVファイルを読み込む際、文字コードに注意が必要です。UTF-8のCSVファイルはそのまま読み込むことができますが、Shift-JISのCSVファイルを読み込むにはencoding
引数に"shift-jis"
を指定する必要があります。これにより、UnicodeDecodeError
を避けることができます。.