Pythonの標準ライブラリであるurllib
は、URLを扱うためのモジュールで、WebページやAPIとの通信が容易になります。
urllibとは?
urllib
はURLにアクセスしたり、インターネット上のリソースを取得することができるパッケージです。urllib
には4つのモジュールが含まれています。
urllib.request
: URLを開いて読むためのモジュールurllib.error
:urllib.request
が発生させる例外urllib.parse
: URLをパースするためのモジュールurllib.robotparser
: robots.txtファイルをパースするためのモジュール
urllib.requestの利用
urllib.request
は、Webサイトにあるデータにアクセスすることが出来ます。
import urllib.request
# URLを指定してリクエストを送信し、レスポンスを受け取る
response = urllib.request.urlopen("http://example.com")
# レスポンスの内容を表示する
print(response.read().decode())
ファイルのダウンロード
urllib
を使用してページの内容を取得し、ファイルに保存することができます。
import urllib.request
url = "http://example.com"
response = urllib.request.urlopen(url)
html = response.read().decode('utf-8')
with open("example.html", "w") as file:
file.write(html)
このコードを実行すると、example.html
という名前のファイルが作成され、指定したURLからダウンロードされた内容が保存されます。
以上がPythonのurllib
を使った基本的なファイル操作の一部です。これらの知識を活用して、より複雑なプログラムを作成することができます。