\

Pythonのデータ分析ライブラリであるPandasを使用して、複数のDataFrameを連結する方法について解説します。

DataFrameの連結

Pandasには、複数のDataFrameを連結するためのconcat関数が提供されています。この関数は、リストまたはタプルに格納されたDataFrameを連結します。

import pandas as pd

# 2つのDataFrameを作成
df1 = pd.DataFrame({
    "col_a": ["a", "aa", "A", "AA", "aA"],
    "col_b": ["b", "bb", "B", "BB", "bB"],
    "col_c": ["c", "cc", "C", "CC", "cC"]
})

df2 = pd.DataFrame({
    "col_c": ["c", "cc", "C", "CC", "cC"],
    "col_d": ["d", "dd", "D", "DD", "dD"],
    "col_e": ["e", "ee", "E", "EE", "eE"]
})

# df1とdf2を連結
df3 = pd.concat(objs=[df1, df2])

連結の軸方向の指定

concat関数のaxisパラメータを使用して、連結の軸方向を指定することができます。デフォルトでは縦方向に結合しますが、横方向の連結も可能です。

# 横方向に連結(axis=1)
df3 = pd.concat([df1, df2], axis=1)

結合方法の指定

連結するDataFrameのすべての値を結合(外部結合)するか、共通部分のみを結合(内部結合)するかを指定できます。

# 外部結合(デフォルト)
df3 = pd.concat([df1, df2], join="outer")

# 内部結合
df3 = pd.concat([df1, df2], join="inner")

以上がPythonとPandasを使用したDataFrameの連結についての基本的な解説です。この知識を活用して、データ分析の作業をより効率的に進めてください。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です