PythonのNumPyライブラムには、データ分析に非常に便利なヒストグラム作成関数が含まれています。この記事では、その関数の基本的な使い方を紹介します。
np.histogram関数の基本的な使い方
まずは、NumPyのnp.histogram
関数の基本的な使い方から見ていきましょう。
import numpy as np
# 標準正規分布に従う乱数を1000個生成
a = np.random.randn(1000)
# histogramとbinの境界値をa_histとa_binsに代入
a_hist, a_bins = np.histogram(a)
print("aの度数:", a_hist)
print("a_histのshape:", a_hist.shape)
print("aの階級を区切る値:", a_bins)
print("a_binsのshape:", a_bins.shape)
このコードでは、まずnp.random.randn(1000)
を使用して標準正規分布に従う乱数を1000個生成しています。次に、np.histogram
関数を使用して、生成した乱数のヒストグラムを作成しています。
ヒストグラムの可視化
ヒストグラムはデータの全体像を見るときに重要なツールです。以下のコードは、matplotlib.pyplot
を使用してヒストグラムをプロットする方法を示しています。
import matplotlib.pyplot as plt
plt.hist(a, bins='auto')
plt.title("Histogram with 'auto' bins")
plt.show()
このコードでは、plt.hist
関数を使用してヒストグラムをプロットしています。bins
パラメータに'auto'
を指定すると、ビンの数が自動的に決定されます。
以上がPythonとNumPyを使用したヒストグラムの作成方法になります。データ解析・機械学習において、データの全体像を俯瞰するのは非常に大切なステップです。ヒストグラムはその一つの手段となりますので、ぜひ活用してみてください。.