PythonのPandasライブラリを使用して、複数のデータフレームを結合する方法について説明します。特に、同じ列を持つ複数のデータフレームを行方向に結合する方法、すなわち「ユニオン」に焦点を当てます。
Pandasのconcatとappendを使用したデータフレームの結合
Pandasでは、concat
やappend
を使用して、複数のデータフレームを結合することができます。
例えば、次のような同じ列を持つ2つのデータフレーム df1
、df2
を結合する場合、以下のように記述します。
import pandas as pd
# データフレームの作成
df1 = pd.DataFrame({'one' : [1., 2., 3., 4.], 'two' : [4., 3., 2., 1.]})
df2 = pd.DataFrame({'one' : [5., 6., 7., 8.], 'two' : [9., 10., 11., 12.]})
# データフレームの結合
df = pd.concat([df1, df2])
このコードは、df1
とdf2
を結合し、新たなデータフレーム df
を作成します。pd.concat
関数は、リスト形式でデータフレームを渡すため、2つ以上のデータフレームを一度に結合することが可能です。
注意点
データフレームを結合する際には、列名が一致していることが重要です。列名が一致しない場合、結合結果の該当列には NaN
値が挿入されます。
以上、PythonのPandasライブラリを使用して、複数のデータフレームを結合する方法について説明しました。これらのテクニックは、大量のデータを扱うデータ分析の現場で頻繁に使用されます。.