Pythonはデータ分析に非常に便利な言語で、その中でもCSVファイルの操作は頻繁に行われます。今回はPythonを使ってCSVファイルから表を作成する方法について解説します。
Pandasライブラリを使った表作成
Pythonで表を作成する際には、Pandasという強力なデータ分析ライブラリがよく使われます。Pandasの中にはDataFrameという機能があり、これを使うと2次元の表形式のデータを簡単に操作できます。
CSVファイルの読み込み
まずはCSVファイルを読み込みます。Pandasにはread_csvというメソッドがあり、これを使うとデータを読み込んでDataFrameに変換することができます。
import pandas as pd
df = pd.read_csv('your_file.csv')
表の作成
次に、読み込んだデータから表を作成します。以下に一例を示します。
# 2次元リストの作成
data = [
['row0', 1, 100, 0.33, 'AAA', 'AAA100'],
['row1', 2, 200, 0.67, 'BBB', 'BBB200'],
['row2', 3, 300, 1, 'CCC', 'CCC300'],
['row3', 4, 400, 1.33, 'DDD', 'DDD400'],
['row4', 5, 500, 1.67, 'EEE', 'EEE500'],
['row5', 6, 600, 2, 'FFF', 'FFF600']
]
# DataFrameの作成
df = pd.DataFrame(data)
# 列名の変更
df.columns = ['','col0','col1','col2','col3','col4']
# 行名となる列を指定
df = df.set_index('')
このようにPythonとPandasを使うと、簡単にCSVファイルから表を作成することができます。さらに、Pandasにはデータの集計や加工、絞り込みなど、データ分析に必要な機能が豊富に用意されています。
PythonとPandasを活用して、効率的なデータ分析を行いましょう。