Pythonのデータ分析ライブラリであるPandasを使用して、ヒストグラムを作成する方法について説明します。ヒストグラムは、データの分布を視覚的に理解するのに非常に役立つツールです。
Pandasのヒストグラム関数
Pandasには、ヒストグラムを作成するための関数 hist()
が存在します。この関数は値を表示するのではなく、ヒストグラムをmatplotlibを使ってプロットします。頻度の数値データが欲しい場合は values_counts
関数が便利です。
import pandas as pd
import matplotlib.pyplot as plt
# データの読み込み
df = pd.read_csv("data.csv")
# ヒストグラムの作成
df['column_name'].hist(bins=20)
plt.show()
上記のコードでは、hist()
関数を使用してヒストグラムを作成しています。bins
パラメータは、ヒストグラムの棒の数を指定します。
非数値データのヒストグラム
非数値データの頻度をヒストグラムで表示する場合、value_counts
関数と plot
関数を使用します。
# 非数値データの頻度をヒストグラムで表示
df['non_numeric_column'].value_counts().plot(kind='bar')
plt.show()
上記のコードでは、value_counts
関数で非数値データの頻度を計算し、plot
関数で棒グラフを作成しています。
まとめ
この記事では、PythonのPandasライブラリを使用してヒストグラムを作成する方法について説明しました。ヒストグラムは、データの分布を視覚的に理解するのに非常に役立つツールです。Pandasの hist
関数や value_counts
関数を使用することで、簡単にヒストグラムを作成することができます。.