\

データセットの準備

まずは、必要なライブラリをインポートし、Irisデータセットをロードします。

from sklearn.datasets import load_iris
import pandas as pd

iris = load_iris()
data = iris.data
feature_names = iris.feature_names
df = pd.DataFrame(data=data, columns=feature_names)

これで、IrisデータセットがPandasのデータフレームとして利用可能になります。

データの確認

データフレームの先頭5行を表示してみましょう。

df.head()

データの分割

次に、データを学習用とテスト用に分割します。

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(df_data, df_target)

モデルの作成と学習

今回はRandomForestを利用します。

from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier()
model.fit(x_train, y_train)

推論と評価

学習したモデルで予測をし、その精度を確認します。

from sklearn.metrics import accuracy_score

pred = model.predict(x_test)
accuracy = accuracy_score(y_test, pred)
print(f"Accuracy: {accuracy}")

以上で、Pythonとscikit-learnを用いたIrisデータセットの機械学習が完了です。この記事がPythonと機械学習の学習に役立つことを願っています。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です