\

Pandasとは

PandasはPythonのデータ整形用ライブラリの1つです。データ解析を支援する機能を提供するライブラリで、CSVファイルを読み取るための機能や、Excelのデータを取り込む機能、データをグラフ化にする機能など、データ解析でよく使うものがまとめられています。

Pandasの基本的なデータ構造

Pandasでは、データを整形していく上での基本的なデータ構造として、SeriesDataFrameがあります。

  • Series:1次元配列データ
  • DataFrame:2次元配列データ
# Seriesの作成
import pandas as pd
s = pd.Series([1, 11, 111, 1111])
print(s)

# DataFrameの作成
df = pd.DataFrame([
    [1, 11, 111],
    [2, 22, 222],
    [3, 33, 333],
    [4, 44, 444]
])
print(df)

ファイルの読み込み・書き出し

Pandasでは、CSVファイルやExcelファイルの読み込み・書き出しが可能です。

# CSVファイルの読み込み
data = pd.read_csv("sample.csv", encoding="cp932")

# CSVファイルの書き出し
df.to_csv("output.csv")

以上、PythonとPandasを活用したデータ解析の基本的な手法について紹介しました。これらの基本的な操作をマスターすることで、より高度なデータ解析が可能となります。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です