\

PythonとPandasを使ってCSVファイルを読み込む際、文字コードがUTF-8やShift-JISである場合があります。この記事では、それぞれの文字コードをどのように扱うかについて説明します。

CSVファイルの読み込み

PythonのPandasライブラリを使ってCSVファイルを読み込む基本的なコードは以下の通りです。

import pandas as pd
df = pd.read_csv("file/to/path")

しかし、このコードはCSVファイルの文字コードがUTF-8であることを前提としています。もしCSVファイルの文字コードがShift-JISである場合、UnicodeDecodeErrorが発生する可能性があります。

Shift-JISのCSVファイルの読み込み

Shift-JISのCSVファイルを読み込むには、read_csv関数のencoding引数に"shift-jis"を指定します。

df = pd.read_csv("file/to/path", encoding="shift-jis")

このコードにより、Shift-JISのCSVファイルも問題なく読み込むことができます。

まとめ

PythonとPandasを使ってCSVファイルを読み込む際、文字コードに注意が必要です。UTF-8のCSVファイルはそのまま読み込むことができますが、Shift-JISのCSVファイルを読み込むにはencoding引数に"shift-jis"を指定する必要があります。これにより、UnicodeDecodeErrorを避けることができます。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です