Pythonで特定のフォルダ内のすべてのファイルを読み込む方法について説明します。この操作は、データ分析や自動化タスクなど、様々な場面で役立ちます。
ファイルパスの取得
まずは、特定のディレクトリ内にあるすべてのファイルのパスを取得する方法から始めましょう。これにはglob
というライブラリのglob()
関数を使用します。
import glob
# ディレクトリ内のすべてのファイルのパスを取得
path_list = glob.glob('your_directory/*')
このコードは、指定したディレクトリ内のすべてのファイルのパスを取得し、それをpath_list
というリストに格納します。
ファイルの読み込み
次に、取得したファイルパスを順に読み込みます。ここでは、pandasのread_csv()
関数を使用してCSVファイルを読み込む例を示します。
import pandas as pd
# 空のデータフレームを作成
data = pd.DataFrame()
# ファイルパスのリストから順にファイルを読み込み、データフレームに追加
for file_path in path_list:
tmp = pd.read_csv(file_path)
data = pd.concat([data, tmp], sort=True)
このコードは、まず空のデータフレームを作成し、次にpath_list
の各ファイルパスから順にファイルを読み込み、それをデータフレームに追加しています。
以上が、Pythonで特定のフォルダ内のすべてのファイルを読み込む基本的な方法です。これらのコードを適切に組み合わせて使用することで、大量のファイルを効率的に処理することが可能になります。