\

Pandasとは

PandasはPythonのデータ分析ライブラリの1つで、大きな表形式のデータを扱うことができます。Pandasは誰でも無料で使えるオープンソースであり、データ分析を行う上で必須なライブラリです。

Pandasの基本的なデータ構造

Pandasでは、以下の2つの基本的なデータ構造を使用します。

  • Series: 1次元配列データ
  • DataFrame: 2次元配列データ

Seriesの作成

import pandas as pd
s = pd.Series([1, 11, 111, 1111])
print(s)

DataFrameの作成

import pandas as pd
df = pd.DataFrame([
    [1, 11, 111],
    [2, 22, 222],
    [3, 33, 333],
    [4, 44, 444]
])
print(df)

ファイルの読み込み・書き出し

Pandasでは、CSVやExcelなどのファイルの読み込み・書き出しが可能です。

CSVファイルの読み込み

import pandas as pd
data = pd.read_csv("sample.csv", encoding="cp932")
print(data)

CSVファイルの書き出し

df.to_csv("output.csv")

以上がPandasの基本的な使い方になります。これらの基本を押さえておけば、データ分析の初歩的な部分をPythonで行うことが可能になります。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です