\

PythonとBeautifulSoupを使ってHTMLのliタグから情報を取得する方法

投稿者 admin 2024年7月21日

PythonのライブラリであるBeautifulSoupは、HTMLやXMLからデータを抽出するための強力なツールです。特に、HTMLの<li>タグから情報を取得する際には、BeautifulSoupが非常に役立ちます。

以下に、BeautifulSoupを使ってHTMLの<li>タグから情報を取得する基本的なコードを示します。

from bs4 import BeautifulSoup

# HTMLの例
html = """
<ul id="front">
    <li class="icon-01">乗用車</li>
    <li class="icon-02">トラック</li>
    <li class="icon-11">軽自動車</li>
</ul>
"""

# BeautifulSoupオブジェクトを作成
soup = BeautifulSoup(html, "lxml")

# idが"front"の<ul>タグを取得
ul_tag = soup.find("ul", id="front")

# <li>タグのテキストをリストに保存
li_texts = [li.text for li in ul_tag.find_all('li')]

print(li_texts)  # ['乗用車', 'トラック', '軽自動車']

このコードは、HTMLの<ul>タグの中にある<li>タグのテキストをすべて取得し、それらをリストに保存します。このように、BeautifulSoupを使えば、HTMLの構造を理解し、特定のタグから情報を効率的に抽出することが可能です。

以上が、PythonとBeautifulSoupを使ってHTMLの<li>タグから情報を取得する基本的な方法です。Webスクレイピングにおいて、このような技術は非常に重要で、多くの場面で役立つでしょう。ぜひ活用してみてください。

投稿者 admin

コメントを残すコメントをキャンセル

Pandasでデータフレームの要約統計量を計算する方法

ラズベリーパイとPythonを使用した画像処理

Javaでのプロキシの設定方法

WindowsでPythonを動かす方法