Pythonで特定のフォルダ内の全てのファイルを読み込む方法について解説します。この操作は、大量のデータを扱う際や、自動化スクリプトを作成する際に非常に便利です。
ファイルのパスを取得する
まずは、特定のディレクトリ内にある全てのファイルのパスを取得します。これにはglob
モジュールのglob
関数を使用します。
import glob
# ディレクトリ内の全てのファイルを取得
path_list = glob.glob('your_directory/*')
上記のコードでは、your_directory
にある全てのファイルのパスを取得しています。*
は任意の文字列を表すワイルドカードです。
ファイルを読み込む
次に、取得したパスリストを元に、順番にファイルを読み込みます。ここでは例として、全てのファイルがCSV形式であると仮定し、pandasのread_csv
関数を使用して読み込みます。
import pandas as pd
# 空のデータフレームを作成
data = pd.DataFrame()
# 全てのファイルを読み込む
for file_path in path_list:
tmp = pd.read_csv(file_path)
data = pd.concat([data, tmp], sort=True)
上記のコードでは、path_list
に格納された全てのファイルパスに対して、read_csv
関数を使用してデータを読み込み、それをdata
データフレームに連結しています。
以上がPythonで特定のフォルダ内の全てのファイルを読み込む基本的な方法です。この方法を覚えておけば、大量のデータファイルを効率的に処理することが可能になります。.