\

PythonのNumPyライブラムには、データ分析に非常に便利なヒストグラム作成関数が含まれています。この記事では、その関数の基本的な使い方を紹介します。

np.histogram関数の基本的な使い方

まずは、NumPyのnp.histogram関数の基本的な使い方から見ていきましょう。

import numpy as np

# 標準正規分布に従う乱数を1000個生成
a = np.random.randn(1000)

# histogramとbinの境界値をa_histとa_binsに代入
a_hist, a_bins = np.histogram(a)

print("aの度数:", a_hist)
print("a_histのshape:", a_hist.shape)
print("aの階級を区切る値:", a_bins)
print("a_binsのshape:", a_bins.shape)

このコードでは、まずnp.random.randn(1000)を使用して標準正規分布に従う乱数を1000個生成しています。次に、np.histogram関数を使用して、生成した乱数のヒストグラムを作成しています。

ヒストグラムの可視化

ヒストグラムはデータの全体像を見るときに重要なツールです。以下のコードは、matplotlib.pyplotを使用してヒストグラムをプロットする方法を示しています。

import matplotlib.pyplot as plt

plt.hist(a, bins='auto')
plt.title("Histogram with 'auto' bins")
plt.show()

このコードでは、plt.hist関数を使用してヒストグラムをプロットしています。binsパラメータに'auto'を指定すると、ビンの数が自動的に決定されます。

以上がPythonとNumPyを使用したヒストグラムの作成方法になります。データ解析・機械学習において、データの全体像を俯瞰するのは非常に大切なステップです。ヒストグラムはその一つの手段となりますので、ぜひ活用してみてください。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です