Requestsモジュールとは
Requestsは、PythonのHTTP通信ライブラリです。Requestsを使うとWebサイトの情報取得や画像の収集などを簡単に行えます。Pythonには標準でurllibというライブラリが存在しますが、Requestsはそれよりもシンプルに、人が直感的に分かりやすいプログラムを記述できます。
Requestsモジュールの使い方
まずはRequestsライブラリをインストールしましょう。パソコンがMacやLinuxならターミナル、Windowsならコマンドプロンプトから以下のコマンドでインストールします。
pip install requests
Requestsの利用方法は以下の通りです。
requests.request(method, url, オプション)
methodには”get”や”post”などを指定しますが、あらかじめmethodが指定されているメソッドも用意されています。
requests.get(url,オプション)
requests.post(url,オプション)
requests.put(url,オプション)
requests.delete(url,オプション)
requests.head(url,オプション)
requests.options(url,オプション)
urlには情報を収集するWebサイトのURLを指定します。オプションの指定方法などは、HTTPを通してどの部分の情報を取得するかによって異なります。
実際に書いてみよう
今回のサンプルプログラムでは、Requestsライブラリを使用してWebサイトから情報を取得する方法を確認します。今回はYahooニュースから情報を取得してみます。
import requests
r = requests.get("https://news.yahoo.co.jp/")
print(r.text)
このコードを実行すると、YahooニュースのHTMLが出力されます。ただし、このままでは情報が多すぎますので、実際の処理ではBeautiful SoupなどでWebサイトの必要な情報だけを適宜選択します。