Pythonのデータ分析ライブラリであるPandasとMatplotlibを使用して、データフレームの各列のヒストグラムを作成する方法について説明します。
データの準備
まずは、ヒストグラムを作成するためのデータを準備します。ここでは、NumPyを使用して正規分布に従った乱数を生成します。
import numpy as np
# ヒストグラム用データを準備
x = np.random.randn(10000)
このサンプルデータは、正規分布に従った乱数を10,000個生成したものです。
ヒストグラムの作成
次に、Matplotlibのhist
関数を使用してヒストグラムを作成します。
import matplotlib.pyplot as plt
# ヒストグラムの作成
plt.hist(x, bins=100)
plt.show()
bins
パラメータは、データの区間(階級)の数を指定します。ここでは100を指定しています。
ヒストグラムの装飾
ヒストグラムの見た目を変更するために、いくつかの装飾を追加します。
# グラフの装飾
plt.xlim(5, 55) # x軸の表示範囲
plt.ylim(0, 30) # y軸の表示範囲
plt.title("Store Visitors", fontsize=20) # タイトル
plt.xlabel("Age", fontsize=20) # x軸ラベル
plt.ylabel("Frequency", fontsize=20) # y軸ラベル
plt.grid(True) # 目盛線の表示
plt.tick_params(labelsize = 12) # 目盛線のラベルサイズ
# ヒストグラムの描画
plt.hist(x, bins=100, alpha=0.5, color='c')
plt.show()
以上で、Pythonを使用して列ごとのヒストグラムを作成する方法について説明しました。この方法を使用すれば、データの分布を視覚的に理解することができます。.