PythonのPandasライブラリを使用して、複数のDataFrameを結合する方法について説明します。この操作は、データベースのSQLでのUNION操作に相当します。
DataFrameの結合(UNION)
同じ列を持つ複数のDataFrameを縦方向(行を増やす方向)に連結する操作を行単位の連結(UNION)と言います。Pandasでは、concat()
やappend()
を利用して、複数のDataFrameを連結(UNION)することができます。
以下に、2つのDataFrame df1
とdf2
を連結して新しいDataFrame df3
を作成する例を示します。
import pandas as pd
# DataFrame df1の作成
list1 = [["P001","iPhone 8 64GB",85000], ["P002","iPhone X 256GB",130000], ["P003","iPhone SE 32GB",37000]]
columns1 =["Product ID","Product Name","Price (JPY)"]
df1 = pd.DataFrame(data=list1,columns=columns1)
# DataFrame df2の作成
list2 = [["P004", "iPhone 7 32GB", 10000], ["P005", "iPhone 8 Plus 256GB", 62000]]
df2 = pd.DataFrame(data=list2, columns=columns1)
# DataFrame df1とdf2を連結してdf3を作成
df3 = df1.append(df2, ignore_index=True)
このコードは、df1
とdf2
を連結して新しいDataFrame df3
を作成します。ignore_index=True
を指定することで、新たにインデックスが振り直されます。
まとめ
PythonのPandasライブラリを使用すると、複数のDataFrameを簡単に結合することができます。これは、データ分析作業において非常に便利な機能です。さまざまなデータ操作を行うために、Pandasの使い方をぜひマスターしてください。.