\

Pythonのpandasライブラリには、データフレームを連結するための便利な関数concatがあります。この記事では、その使用方法を具体的に解説します。

pandas.concatの基本的な使い方

concat関数は、複数のデータフレームを縦方向または横方向に結合する手段です。以下に基本的な使用方法を示します。

import pandas as pd

# 2つのデータフレームを作成
df1 = pd.DataFrame({"col_a": ["a", "aa", "A", "AA", "aA"], "col_b": ["b", "bb", "B", "BB", "bB"], "col_c": ["c", "cc", "C", "CC", "cC"]})
df2 = pd.DataFrame({"col_c": ["c", "cc", "C", "CC", "cC"], "col_d": ["d", "dd", "D", "DD", "dD"], "col_e": ["e", "ee", "E", "EE", "eE"]})

# df1とdf2を連結
df3 = pd.concat([df1, df2])

このコードでは、df1df2という2つのデータフレームを作成し、それらをpd.concat関数を使用して連結しています。

連結の軸方向を指定する

concat関数のaxis引数を使用すると、連結の軸方向を指定することができます。デフォルトでは縦方向に結合しますが、横方向の連結も可能です。

# 横方向に連結(axis=1)
df3 = pd.concat([df1, df2], axis=1)

このコードでは、axis=1を指定することでデータフレームを横方向に連結しています。

結合方法の指定

concat関数のjoin引数を使用すると、連結するデータフレームのすべての値を結合(外部結合)するか、共通部分のみを結合(内部結合)するかを指定できます。

# 内部結合
df3 = pd.concat([df1, df2], join="inner")

このコードでは、join="inner"を指定することで、連結するデータフレームの共通する列名の値だけが結合されます。

以上がpandas.concatの基本的な使い方です。データ分析を行う際に、この関数を活用してデータの整形を行うことができます。.

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です