PythonとPandasを使用してデータフレームからグラフを作成する方法について説明します。この記事では、折れ線グラフ、棒グラフ、散布図、ヒストグラム、箱ひげ図など、主なグラフの種類とその作成方法を紹介します。
ライブラリのインポート
まずは必要なライブラリをインポートします。ここではpandas
とmatplotlib
を使用します。
import warnings
import pandas as pd
import matplotlib.pyplot as plt
サンプルデータの準備
次に、グラフ作成のためのサンプルデータを準備します。ここでは、sklearn
からアヤメのデータを使用します。
from sklearn.datasets import load_iris
iris = load_iris()
iris_x = pd.DataFrame(iris.data, columns=list(iris.feature_names))
iris_y = pd.DataFrame(iris.target, columns=["target"])
iris_label = {0:'setosa', 1:'versicolor', 2:'virginica'}
iris_y['target'] = iris_y['target'].map(iris_label)
iris_df = pd.concat([iris_x, iris_y], axis=1)
グラフの作成
データフレームからグラフを生成する方法は2種類あります。df.plot(kind="line")
またはdf.plot.line()
を使用します。
折れ線グラフ
折れ線グラフは、df.plot()
またはdf.plot(kind="line")
で作成できます。
iris_df.plot()
棒グラフ
棒グラフは、df.plot(kind="bar")
で作成できます。
iris_target = iris_df.groupby("target").mean()
iris_target.plot(kind="bar", figsize=(8,5))
散布図
散布図は、df.plot(kind="scatter", x="column1", y="column2")
で作成できます。
iris_df.plot(kind="scatter", x="sepal length (cm)", y="sepal width (cm)")
以上がPythonとPandasを使用してデータフレームからグラフを作成する基本的な方法です。これらの基本を理解すれば、さまざまなデータを視覚化することができます。データ分析の一環として、ぜひ活用してみてください。.