PythonのHTTPクライアントライブラリである requests
を利用して、Web上のファイルをダウンロードする方法について説明します。
ファイルダウンロードの基本
まずは、requests.get()
を使用して、ファイルダウンロードのURLにアクセスします。このメソッドにダウンロードするURLを文字列として渡すと、Responseオブジェクトが戻り値として得られます。
import requests
url = "ダウンロードしたいファイルリンクを記載"
response = requests.get(url)
ファイル情報の取得
次に、requests
の headers
を利用してHTTPレスポンスヘッダからContentTypeや添付ファイルのファイル名を取得します。
contentType = response.headers['Content-Type']
contentDisposition = response.headers['Content-Disposition']
ATTRIBUTE = 'filename='
fileName = contentDisposition[contentDisposition.find(ATTRIBUTE) + len(ATTRIBUTE):]
ファイルの保存
最後に、requests
のHTTPレスポンスの content
を利用してダウンロードファイルのデータにアクセスし、バイナリデータをファイルとして保存します。
saveFilePath = os.path.join(DOWNLOAD_SAVE_DIR, saveFileName)
with open(saveFilePath, 'wb') as saveFile:
saveFile.write(response.content)
以上がPythonとRequestsを使用したWebファイルダウンロードの基本的な手順です。これらの手順を組み合わせることで、様々なWeb上のファイルを効率的にダウンロードすることが可能になります。