\

Pythonはデータ分析に非常に便利な言語で、その中でもmatplotlibpandasseabornといったライブラリを使うと、データの分布を一括でヒストグラムとして描画することが可能です。

まずは必要なライブラリをインポートします。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

次に、データを読み込みます。ここではsklearn.datasetsload_bostonを使用しますが、自分のデータを使用することも可能です。

from sklearn.datasets import load_boston
X = load_boston()
df = pd.DataFrame(X.data, columns=X.feature_names)

そして、各カラムの分布を一括で描画します。以下のようにmatplotlibpandas plotseabornの3つの方法で描画することができます。

fig = plt.figure(figsize=(25, 25))

# matplotlibで一括描画
for i, col in enumerate(df.columns):
    plt.subplot2grid((5, 3), (i//3, i%3))
    plt.hist(df[col])
    plt.title(col)

# pandas plotで一括描画
for i, col in enumerate(df.columns):
    ax = plt.subplot2grid((5, 3), (i//3, i%3))
    df[col].plot(kind='hist', ax=ax)
    ax.set_title(col)

# seabornで一括描画
for i, col in enumerate(df.columns):
    ax = plt.subplot2grid((5, 3), (i//3, i%3))
    sns.histplot(df[col], ax=ax)
    ax.set_title(col)

以上で、Pythonを使って一括でヒストグラムを描画する方法を紹介しました。これにより、大量のデータの分布を一度に確認することが可能となります。データ分析において、このような視覚的な情報は非常に有用です。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です