Pandasとは
PandasはPythonのデータ分析ライブラリの1つで、大きな表形式のデータを扱うことができます。Pandasは誰でも無料で使えるオープンソースであり、データ分析を行う上で必須なライブラリです。
Pandasの基本的なデータ構造
Pandasでは、以下の2つの基本的なデータ構造を使用します。
- Series: 1次元配列データ
- DataFrame: 2次元配列データ
Seriesの作成
import pandas as pd
s = pd.Series([1, 11, 111, 1111])
print(s)
DataFrameの作成
import pandas as pd
df = pd.DataFrame([
[1, 11, 111],
[2, 22, 222],
[3, 33, 333],
[4, 44, 444]
])
print(df)
ファイルの読み込み・書き出し
Pandasでは、CSVやExcelなどのファイルの読み込み・書き出しが可能です。
CSVファイルの読み込み
import pandas as pd
data = pd.read_csv("sample.csv", encoding="cp932")
print(data)
CSVファイルの書き出し
df.to_csv("output.csv")
以上がPandasの基本的な使い方になります。これらの基本を押さえておけば、データ分析の初歩的な部分をPythonで行うことが可能になります。.