有什么方法可以找到您当前正在抓取的 URL 吗?
Is there any way to find the URL that you are currently scraping?
我目前正在尝试创建一个蜘蛛,它会抓取每个结果并从每个结果中获取一些信息。唯一的问题是我不知道如何找到我当前所在的 URL(我也需要检索它)。
有什么办法吗?
我知道如何使用 Selenium 和 Scrapy-Selenium 来做到这一点,但我在这个项目中只使用了一个简单的 CrawlSpider。
您可以使用:
current_url = response.request.url
我目前正在尝试创建一个蜘蛛,它会抓取每个结果并从每个结果中获取一些信息。唯一的问题是我不知道如何找到我当前所在的 URL(我也需要检索它)。
有什么办法吗?
我知道如何使用 Selenium 和 Scrapy-Selenium 来做到这一点,但我在这个项目中只使用了一个简单的 CrawlSpider。
您可以使用:
current_url = response.request.url