Pythonはデータ分析やデータ加工に広く使われています。特に、CSVファイルの操作は日常的なタスクとなっています。この記事では、PythonでCSVファイルの列を操作する方法について解説します。
Pandasライブラリの利用
PythonのPandasライブラリは、データ分析における強力なツールです。Pandasを使用すると、CSVファイルの読み込み、データ型の調査、行数や列数の取得、特定の列の取得などが可能です。
import pandas as pd
# CSVファイルの読み込み
df = pd.read_csv('data.csv', encoding='shift-jis')
# データ型を調べる
print(df.dtypes)
# 行数、列数を取得する
print(df.shape)
# 列を取得する
series_population = df['人口(総数)']
print(series_population)
locとilocの使用
Pandasのloc
とiloc
メソッドを使用すると、行と列のデータを効率的に取得できます。
# locを使用して行と列を取得する
print(df.loc[9, '都道府県名'])
# ilocを使用して列を取得する
print(df.iloc[:, 5:8])
CSVファイルへの書き込み
Pythonのcsv.writer
やPandasを使用すると、CSVファイルへの列指定書き込みを行うことができます。
以上、PythonでCSVファイルの列を操作する基本的な方法について解説しました。これらのテクニックを駆使することで、データ分析やデータ加工の作業を効率化することができます。.