如何在 Scrapy 中使用 xpath 来抓取没有 class 或属性的标签?
How to use xpath in Scrapy to scrape a tag without a class or attribute?
我正在尝试抓取 html 文件,但标签没有任何 class 或 ID。有没有办法在不使用常规 '//*[class="blah"]/' 格式的情况下为此获取 xpath?
似乎可以选择只使用标签,但如果您想查看特定元素,则需要知道特定标签的索引
例如 shell
response.xpath('//html/body/table[1]')
如果 body 标签内有多个带有 table 标签的元素,那么 [1] 将指定第一个 table 标签(xpath 从 1 开始计数)
我正在尝试抓取 html 文件,但标签没有任何 class 或 ID。有没有办法在不使用常规 '//*[class="blah"]/' 格式的情况下为此获取 xpath?
似乎可以选择只使用标签,但如果您想查看特定元素,则需要知道特定标签的索引
例如 shell
response.xpath('//html/body/table[1]')
如果 body 标签内有多个带有 table 标签的元素,那么 [1] 将指定第一个 table 标签(xpath 从 1 开始计数)