\

PythonのライブラリであるPandasは、データ分析作業を効率的に行うための強力なツールです。この記事では、Pandasを使ったデータ分析の基本的な手法を紹介します。

Pandas DataFrameの作成

Pandasの中心的なデータ構造はDataFrameです。DataFrameは2次元のラベル付きデータ構造で、異なる型の列を持つことができます。以下に、Pythonのリストや辞書からDataFrameを作成する方法を示します。

import pandas as pd

# リストからDataFrameを作成
df_from_list = pd.DataFrame([
    ['apple', 1],
    ['banana', 2],
    ['cherry', 3]
], columns=['fruit', 'quantity'])

# 辞書からDataFrameを作成
df_from_dict = pd.DataFrame({
    'fruit': ['apple', 'banana', 'cherry'],
    'quantity': [1, 2, 3]
})

Pandas DataFrameの操作

DataFrameの行や列に対する操作は、データ分析作業の一部です。以下に、DataFrameの行や列を選択、ソート、挿入、削除する方法を示します。

# 列の選択
df['fruit']

# 行の選択
df.iloc[0]  # インデックスによる選択
df.loc['apple']  # ラベルによる選択

# 列の挿入
df['price'] = [100, 200, 300]

# 列の削除
df = df.drop(columns='price')

# 行の挿入
df = df.append({'fruit': 'durian', 'quantity': 5}, ignore_index=True)

# 行の削除
df = df.drop(index=0)

# 行のソート
df = df.sort_values('quantity')

以上がPandasを使ったデータ分析の基本的な手法の一部です。これらの手法をマスターすることで、データ分析作業をより効率的に行うことができます。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です