\

Pythonのデータ分析ライブラリであるPandasには、データフレームを連結するためのconcat関数があります。この記事では、その使用方法を具体的に解説します。

pd.concatの基本的な使用方法

pd.concat関数は、複数のデータフレームを連結するための関数です。基本的な使用方法は以下の通りです。

import pandas as pd

# 2つのデータフレームを作成
df1 = pd.DataFrame({
    "col_a": ["a", "aa", "A", "AA", "aA"],
    "col_b": ["b", "bb", "B", "BB", "bB"],
    "col_c": ["c", "cc", "C", "CC", "cC"]
})

df2 = pd.DataFrame({
    "col_c": ["c", "cc", "C", "CC", "cC"],
    "col_d": ["d", "dd", "D", "DD", "dD"],
    "col_e": ["e", "ee", "E", "EE", "eE"]
})

# df1とdf2を連結
df3 = pd.concat([df1, df2])

このコードは、df1df2という2つのデータフレームを縦方向(デフォルト)に連結します。

連結の軸方向を指定

pd.concat関数のaxis引数を使用すると、連結の軸方向を指定できます。デフォルトは縦方向(axis=0)ですが、axis=1を指定すると横方向に連結します。

# 横方向に連結(axis=1)
df3 = pd.concat([df1, df2], axis=1)

このコードは、df1df2を横方向に連結します。

結合方法の指定

pd.concat関数のjoin引数を使用すると、連結するデータフレームのすべての値を結合(外部結合)するか、共通部分のみを結合(内部結合)するかを指定できます。

# 内部結合
df3 = pd.concat([df1, df2], join="inner")

このコードは、df1df2の共通する列名の値だけが結合されます。

以上が、Pandasのconcat関数の基本的な使用方法です。データ分析を行う際に、この関数を使って複数のデータフレームを効率的に連結することができます。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です