PythonのSeleniumライブラリを使用して、XPathを指定してWebページから要素を取得する方法について解説します。
XPathとは
XPathは、XML Path Languageの略で、XMLやHTML形式の文書から特定の部分を指定するときに使う構文です。
XPathの使用場面
要素の取得には、find_element
メソッドを使いますが、引数にはBy.id
、By.name
、By.tagName
等様々な指定方法があります。XPathは以下のような場合に使うと便利です:
- idやclassなどでうまく要素を取得できないとき
- そもそもidやclassなどがない場合
- idやclassなどで要素を一意に特定できない場合
XPathで要素を取得する方法
XPathで要素を取得する方法は、以下になります。
要素の取得 (単数)
driver.find_element(By.XPATH, 'ここにXPathを入れる')
要素の取得 (複数)
driver.find_elements(By.XPATH, 'ここにXPathを入れる')
まとめ
XPathを使用することで、より柔軟にWebページから要素を取得することが可能になります。この知識を活用して、効率的なWebスクレイピングを行いましょう。