PythonのPandasライブラリを使用して、複数のCSVファイルを一つのデータフレームに結合する方法を紹介します。この方法は、大量のデータを扱う際に非常に便利です。
まず、結合したいCSVファイルが保存されているディレクトリのパスを指定します。次に、そのディレクトリ内のすべてのCSVファイルを読み込み、それぞれをPandasのデータフレームとして保存します。最後に、これらすべてのデータフレームを一つのデータフレームに結合します。
以下に、具体的なコードを示します。
import pandas as pd
import glob
import os
path = r'C:\\DRO\\DCL_rawdata_files' # use your path
all_files = glob.glob(os.path.join(path , "*.csv"))
li = []
for filename in all_files:
df = pd.read_csv(filename, index_col=None, header=0)
li.append(df)
frame = pd.concat(li, axis=0, ignore_index=True)
このコードは、指定したディレクトリ内のすべてのCSVファイルを読み込み、それらを一つのデータフレームに結合します。pd.concat
関数は、リスト内のすべてのデータフレームを結合します。
この方法を使用すれば、大量のCSVファイルを効率的に一つのデータフレームに結合することができます。これにより、データ分析や前処理を一貫して行うことが可能になります。
以上、Pythonで複数のCSVファイルを結合する方法についての説明でした。この情報が皆さんのデータ処理作業に役立つことを願っています。