PythonのライブラリであるPandasは、データ分析作業を効率的に行うための強力なツールです。この記事では、Pandasを使ったデータ分析の基本的な手法を紹介します。
Pandas DataFrameの作成
Pandasの中心的なデータ構造はDataFrameです。DataFrameは2次元のラベル付きデータ構造で、異なる型の列を持つことができます。以下に、Pythonのリストや辞書からDataFrameを作成する方法を示します。
import pandas as pd
# リストからDataFrameを作成
df_from_list = pd.DataFrame([
['apple', 1],
['banana', 2],
['cherry', 3]
], columns=['fruit', 'quantity'])
# 辞書からDataFrameを作成
df_from_dict = pd.DataFrame({
'fruit': ['apple', 'banana', 'cherry'],
'quantity': [1, 2, 3]
})
Pandas DataFrameの操作
DataFrameの行や列に対する操作は、データ分析作業の一部です。以下に、DataFrameの行や列を選択、ソート、挿入、削除する方法を示します。
# 列の選択
df['fruit']
# 行の選択
df.iloc[0] # インデックスによる選択
df.loc['apple'] # ラベルによる選択
# 列の挿入
df['price'] = [100, 200, 300]
# 列の削除
df = df.drop(columns='price')
# 行の挿入
df = df.append({'fruit': 'durian', 'quantity': 5}, ignore_index=True)
# 行の削除
df = df.drop(index=0)
# 行のソート
df = df.sort_values('quantity')
以上がPandasを使ったデータ分析の基本的な手法の一部です。これらの手法をマスターすることで、データ分析作業をより効率的に行うことができます。.