データセットの準備
まずは、必要なライブラリをインポートし、Irisデータセットをロードします。
from sklearn.datasets import load_iris
import pandas as pd
iris = load_iris()
data = iris.data
feature_names = iris.feature_names
df = pd.DataFrame(data=data, columns=feature_names)
これで、IrisデータセットがPandasのデータフレームとして利用可能になります。
データの確認
データフレームの先頭5行を表示してみましょう。
df.head()
データの分割
次に、データを学習用とテスト用に分割します。
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(df_data, df_target)
モデルの作成と学習
今回はRandomForestを利用します。
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier()
model.fit(x_train, y_train)
推論と評価
学習したモデルで予測をし、その精度を確認します。
from sklearn.metrics import accuracy_score
pred = model.predict(x_test)
accuracy = accuracy_score(y_test, pred)
print(f"Accuracy: {accuracy}")
以上で、Pythonとscikit-learnを用いたIrisデータセットの機械学習が完了です。この記事がPythonと機械学習の学習に役立つことを願っています。.