Pythonのデータ分析ライブラリであるPandasは、データフレーム(2次元のデータ構造)を操作するための強力なツールを提供しています。その中でも、concat
関数はデータフレームの連結を行うための重要な機能です。
concat
関数は、複数のデータフレームを連結して結合します。具体的には、以下のように使用します。
import pandas as pd
# 2つのデータフレームを作成
df1 = pd.DataFrame({"col_a": ["a", "aa", "A", "AA", "aA"], "col_b": ["b", "bb", "B", "BB", "bB"], "col_c": ["c", "cc", "C", "CC", "cC"]})
df2 = pd.DataFrame({"col_c": ["c", "cc", "C", "CC", "cC"], "col_d": ["d", "dd", "D", "DD", "dD"], "col_e": ["e", "ee", "E", "EE", "eE"]})
# df1とdf2を連結
df3 = pd.concat([df1, df2])
このコードでは、df1
とdf2
という2つのデータフレームを作成し、それらをpd.concat
関数を使用して連結しています。
また、concat
関数は、連結するデータフレームのすべての値を結合(外部結合)するか、共通部分のみを結合(内部結合)するかを指定できます。外部結合は、共通しない部分をNaN(Not a Number)で埋め、内部結合は、連結するデータフレームの共通する列名の値だけが結合されます。
さらに、ignore_index=True
を指定すると、データフレームを連結後、連結の軸方向のインデックスを無視して0から値を振り直します。
以上が、PythonとPandasを使用したデータフレームの列の連結についての基本的な説明です。これらの知識を活用して、データ分析の作業をより効率的に進めてみてください。.