FeatureUnion
は、Pythonのscikit-learn
ライブラリに含まれる機能で、複数の特徴量変換器を並列に適用し、その結果を連結するためのものです。これは、複数の特徴抽出メカニズムを一つの変換器に組み合わせるのに便利です。
以下に、FeatureUnion
の基本的な使用方法を示します。
from sklearn.pipeline import FeatureUnion
from sklearn.preprocessing import FunctionTransformer
# 複数の特徴量を結合する
union = FeatureUnion([
('1.raw', FunctionTransformer(lambda x: x)),
('2.double', FunctionTransformer(lambda x: x*2))
])
上記のコードでは、FeatureUnion
を使用して2つの特徴量(元の値とその2倍の値)を生成し、それらを連結しています。
また、FeatureUnion
はPipeline
モジュールに含まれており、有名なPipeline
関数の兄弟のようなものです。FeatureUnion
の簡易版でmake_union
関数があり、どちらを使用するかは状況によります。
このように、FeatureUnion
は特徴量エンジニアリング時に特徴量を一括処理してまとめるための強力なツールです。これにより、データの前処理とモデルの訓練を一つのパイプラインで効率的に行うことが可能となります。.