使用 scrapy response.css 作为样式标签
Use scrapy response.css for style tag
我想使用 scrapy 库中的函数 response.css()
从初始网站中提取下一页。当像这样嵌入更多页面的 link 时,我找不到任何关于如何使用该功能的提示:
<li style="text-align: left;"><a href="/the/desired/link">NameOfPage</a></li>
这可以用 scrapy 实现吗,还是我应该使用其他类似 BeautifulSoup 的东西?
我不完全确定是否可以使用 css
来实现,但是使用 xpath
很容易表达:
response.xpath('//li[contains(@style, "text-align: left;")]')
xpath 表达式真的很强大,你可以在引入另一个库之前尝试一下。
我想使用 scrapy 库中的函数 response.css()
从初始网站中提取下一页。当像这样嵌入更多页面的 link 时,我找不到任何关于如何使用该功能的提示:
<li style="text-align: left;"><a href="/the/desired/link">NameOfPage</a></li>
这可以用 scrapy 实现吗,还是我应该使用其他类似 BeautifulSoup 的东西?
我不完全确定是否可以使用 css
来实现,但是使用 xpath
很容易表达:
response.xpath('//li[contains(@style, "text-align: left;")]')
xpath 表达式真的很强大,你可以在引入另一个库之前尝试一下。