有没有办法在 lxml 中使用 XPath 获取未知标签链中的 TEXT <tag1>...<tagn>TEXT</tagn>...</tag1>
Are there a way with XPath in lxml for getting TEXT in chain of unknown tags <tag1>...<tagn>TEXT</tagn>...</tag1>
我有一组元素(来自 lxml),带有线性 html 未知标签链,如下所示:
<tag1>...<tagn>TEXT</tagn>...</tag1>
如何使用 xpath 获取文本?
我的意思是,如果我的元素是 elem,我可以使用:
elem.xpath('XPATH')
什么是 XPATH?
从该位置开始,跳过所有内容,直到找到文本:
elem.xpath('.//text()')
我有一组元素(来自 lxml),带有线性 html 未知标签链,如下所示:
<tag1>...<tagn>TEXT</tagn>...</tag1>
如何使用 xpath 获取文本?
我的意思是,如果我的元素是 elem,我可以使用: elem.xpath('XPATH')
什么是 XPATH?
从该位置开始,跳过所有内容,直到找到文本:
elem.xpath('.//text()')