PythonでWebスクレイピングを行う際、XPathを使用してHTML要素を選択することがよくあります。特に、ある要素の親要素を選択する必要がある場合、XPathは非常に便利なツールとなります。
XPathと親要素の選択
XPathでは、「..」を使用して親要素を選択することができます。例えば、ある要素がelm
という名前で、そこから1階層だけ上に行きたい場合は、次のように書きます。
elm.find_element(By.XPATH, "..")
2階層上に行きたい場合は、次のように書きます。
elm.find_element(By.XPATH, "../..")
子要素から親要素を選択する
ある要素(子要素)を条件にして親要素を選択する場合、次のようなXPathの記述を使用します。
input_element = driver.find_element_by_xpath("//a[span[span[contains(text(), '次へ')]]]")
この例では、「次へ」という文字列を含むspan
要素の親要素(a
要素)を選択しています。
まとめ
XPathは、HTML要素の選択において非常に強力なツールです。特に、親要素の選択が必要な場合、XPathの記述方法を理解しておくと、Webスクレイピングがより簡単になります。この記事が、PythonとXPathを使用したWebスクレイピングの参考になれば幸いです。