PythonでWebスクレイピングを行う際には、BeautifulSoupというライブラリがよく使用されます。この記事では、BeautifulSoupのインストール方法と基本的な使い方について解説します。
BeautifulSoupとは?
BeautifulSoupは、HTMLやXMLのパース(解析)を行うためのPythonライブラリです。Webページの情報を抽出するために使用されます。
BeautifulSoupのインストール
BeautifulSoupはPyPIで配布されているため、pipコマンドを使用してインストールすることができます。
pip install beautifulsoup4
BeautifulSoupの基本的な使い方
BeautifulSoupを使用する基本的な流れは以下の通りです。
- HTMLまたはXMLの文字列を用意します。
- パーサを指定して、BeautifulSoupオブジェクトを生成します。
- BeautifulSoupオブジェクトから必要なデータを抽出します。
以下に具体的なコード例を示します。
from bs4 import BeautifulSoup
html = "<body><h1>python入門</h1><p>pythonの基礎について学習します</p></body>"
soup = BeautifulSoup(html, "html.parser")
print(soup.h1)
このコードでは、まずHTMLの文字列を用意し、それを元にBeautifulSoupオブジェクトを生成しています。そして、h1タグの内容を抽出して表示しています。
以上がBeautifulSoupのインストール方法と基本的な使い方になります。PythonでWebスクレイピングを行う際には、このBeautifulSoupが非常に便利なツールとなりますので、ぜひ活用してみてください。