Pythonのpandasライブラリには、データフレームを連結するための便利な関数concat
があります。この記事では、その使用方法を具体的に解説します。
pandas.concatの基本的な使い方
concat
関数は、複数のデータフレームを縦方向または横方向に結合する手段です。以下に基本的な使用方法を示します。
import pandas as pd
# 2つのデータフレームを作成
df1 = pd.DataFrame({"col_a": ["a", "aa", "A", "AA", "aA"], "col_b": ["b", "bb", "B", "BB", "bB"], "col_c": ["c", "cc", "C", "CC", "cC"]})
df2 = pd.DataFrame({"col_c": ["c", "cc", "C", "CC", "cC"], "col_d": ["d", "dd", "D", "DD", "dD"], "col_e": ["e", "ee", "E", "EE", "eE"]})
# df1とdf2を連結
df3 = pd.concat([df1, df2])
このコードでは、df1
とdf2
という2つのデータフレームを作成し、それらをpd.concat
関数を使用して連結しています。
連結の軸方向を指定する
concat
関数のaxis
引数を使用すると、連結の軸方向を指定することができます。デフォルトでは縦方向に結合しますが、横方向の連結も可能です。
# 横方向に連結(axis=1)
df3 = pd.concat([df1, df2], axis=1)
このコードでは、axis=1
を指定することでデータフレームを横方向に連結しています。
結合方法の指定
concat
関数のjoin
引数を使用すると、連結するデータフレームのすべての値を結合(外部結合)するか、共通部分のみを結合(内部結合)するかを指定できます。
# 内部結合
df3 = pd.concat([df1, df2], join="inner")
このコードでは、join="inner"
を指定することで、連結するデータフレームの共通する列名の値だけが結合されます。
以上がpandas.concat
の基本的な使い方です。データ分析を行う際に、この関数を活用してデータの整形を行うことができます。.