使用 scrapy response.css 作为样式标签

Use scrapy response.css for style tag

我想使用 scrapy 库中的函数 response.css() 从初始网站中提取下一页。当像这样嵌入更多页面的 link 时,我找不到任何关于如何使用该功能的提示:

<li style="text-align: left;"><a href="/the/desired/link">NameOfPage</a></li>

这可以用 scrapy 实现吗,还是我应该使用其他类似 BeautifulSoup 的东西?

我不完全确定是否可以使用 css 来实现,但是使用 xpath 很容易表达:

response.xpath('//li[contains(@style, "text-align: left;")]')

xpath 表达式真的很强大,你可以在引入另一个库之前尝试一下。