如何在 Scrapy 中使用 xpath 来抓取没有 class 或属性的标签？

Question

我正在尝试抓取 html 文件，但标签没有任何 class 或 ID。有没有办法在不使用常规 '//*[class="blah"]/' 格式的情况下为此获取 xpath？

Answer 1

似乎可以选择只使用标签，但如果您想查看特定元素，则需要知道特定标签的索引

例如 shell

response.xpath('//html/body/table[1]')

如果 body 标签内有多个带有 table 标签的元素，那么 [1] 将指定第一个 table 标签（xpath 从 1 开始计数）

How to use xpath in Scrapy to scrape a tag without a class or attribute?