Scrapy爬行问题
Scrapy crawling issue
我正在尝试从维基百科抓取,但结果没有返回任何内容。
我在 IPython 控制台中尝试了 运行 简单查询,并使用一个值进行检查,但它仍然没有返回任何值。
我试过这个:
sel.xpath('//div[@id="mw-content-text"]/table/tbody/tr[1]/td[1]/text()').extract()
这将是一个猜测,但是一个有根据的猜测。 tbody
是浏览器插入的内容,也是您在浏览器开发人员工具中看到的内容。但是,Scrapy 不是浏览器 - 从 xpath 表达式中删除 tbody
:
sel.xpath('//div[@id="mw-content-text"]/table/tr[1]/td[1]/text()').extract()
我正在尝试从维基百科抓取,但结果没有返回任何内容。 我在 IPython 控制台中尝试了 运行 简单查询,并使用一个值进行检查,但它仍然没有返回任何值。
我试过这个:
sel.xpath('//div[@id="mw-content-text"]/table/tbody/tr[1]/td[1]/text()').extract()
这将是一个猜测,但是一个有根据的猜测。 tbody
是浏览器插入的内容,也是您在浏览器开发人员工具中看到的内容。但是,Scrapy 不是浏览器 - 从 xpath 表达式中删除 tbody
:
sel.xpath('//div[@id="mw-content-text"]/table/tr[1]/td[1]/text()').extract()