Pythonのライブラリであるlxmlは、XMLやHTMLファイルの処理に使える強力なツールです。この記事では、Pythonとlxmlを使ってXMLファイルを解析し、XPathを利用する方法について説明します。
lxmlのインストール
lxmlはpipを使って簡単にインストールできます。
$ pip install lxml
XMLファイルの読み込み
lxmlを使ってXMLファイルを読み込むには、まずlxmlパッケージからetreeをインポートします。
from lxml import etree
tree = etree.parse('usa-states.xml')
root = tree.getroot()
XMLノードの選択
XMLノードを選択するには、iter
メソッドを使用します。
for state in root.iter('state'):
print(state.attrib)
XPathの利用
XPathは、XML文書内の要素や属性を指定して取得するための言語です。lxmlでは、XPathを使ってXML要素を選択することができます。
states = tree.xpath('/states/state')
if len(states):
for state in states:
print(state.attrib)
以上がPythonとlxmlを使ってXMLの解析とXPathの利用方法の基本です。詳細な情報や他の使用例については、公式ドキュメンテーションを参照してください。