Scrapy 编写未知深度的 XPath 表达式
Scrapy writing XPath expression for unknown depth
我有一个 html 文件,如下所示:
<div id='author'>
<div>
<div>
...
<a> John Doe </a>
不知道作者div下会有多少div。不同页面的深度可能不同。
那么这种 xml 的 XPath 表达式是什么?
顺便说一句,我试过了:
//div[@id = "author"]/*/a/text()
但这似乎只适用于作者 div 的孙辈。
使用双斜杠在 div
元素内的任意位置查找 a
元素 id="author"
:
//div[@id = "author"]//a/text()
我有一个 html 文件,如下所示:
<div id='author'>
<div>
<div>
...
<a> John Doe </a>
不知道作者div下会有多少div。不同页面的深度可能不同。
那么这种 xml 的 XPath 表达式是什么?
顺便说一句,我试过了:
//div[@id = "author"]/*/a/text()
但这似乎只适用于作者 div 的孙辈。
使用双斜杠在 div
元素内的任意位置查找 a
元素 id="author"
:
//div[@id = "author"]//a/text()