Pythonはデータ分析に非常に便利な言語で、その中でもmatplotlib、pandas、seabornといったライブラリを使うと、データの分布を一括でヒストグラムとして描画することが可能です。
まずは必要なライブラリをインポートします。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
次に、データを読み込みます。ここではsklearn.datasetsのload_bostonを使用しますが、自分のデータを使用することも可能です。
from sklearn.datasets import load_boston
X = load_boston()
df = pd.DataFrame(X.data, columns=X.feature_names)
そして、各カラムの分布を一括で描画します。以下のようにmatplotlib、pandas plot、seabornの3つの方法で描画することができます。
fig = plt.figure(figsize=(25, 25))
# matplotlibで一括描画
for i, col in enumerate(df.columns):
plt.subplot2grid((5, 3), (i//3, i%3))
plt.hist(df[col])
plt.title(col)
# pandas plotで一括描画
for i, col in enumerate(df.columns):
ax = plt.subplot2grid((5, 3), (i//3, i%3))
df[col].plot(kind='hist', ax=ax)
ax.set_title(col)
# seabornで一括描画
for i, col in enumerate(df.columns):
ax = plt.subplot2grid((5, 3), (i//3, i%3))
sns.histplot(df[col], ax=ax)
ax.set_title(col)
以上で、Pythonを使って一括でヒストグラムを描画する方法を紹介しました。これにより、大量のデータの分布を一度に確認することが可能となります。データ分析において、このような視覚的な情報は非常に有用です。.