Pythonは、ウェブからファイルをダウンロードするためのいくつかの方法を提供しています。ここでは、その中から主要な3つの方法を紹介します。
1. requestsモジュールを使用する
requestsモジュールは、PythonでHTTPリクエストを送信するための人気のあるライブラリです。ファイルをダウンロードするためには、requests.get()
関数を使用してURLからデータを取得し、その内容をファイルに書き込みます。
import requests
url = 'http://example.com/some_file.pdf'
r = requests.get(url)
with open('some_file.pdf', 'wb') as f:
f.write(r.content)
2. urllibモジュールを使用する
urllibはPythonの標準ライブラリで、URLを扱うためのモジュールです。urllib.request.urlretrieve()
関数を使用すると、指定したURLからファイルをダウンロードし、ローカルのファイルシステムに保存することができます。
import urllib.request
url = 'http://randomsite.com/file.gz'
save_name = 'file.gz'
urllib.request.urlretrieve(url, save_name)
3. pandasを使用する
pandasは、Pythonでデータ分析を行うためのライブラリです。pandasのread_json()
関数を使用すると、URLから直接JSONファイルを読み込むことができます。
import pandas as pd
url = 'https://nlp100.github.io/data/jawiki-country.json.gz'
df = pd.read_json(url, lines=True)
これらの方法を使えば、Pythonでウェブからファイルをダウンロードすることが可能です。適切な方法を選んで、Pythonの力を最大限に活用しましょう。