如何通过scrapy从搜索引擎中获取数据

How to fech data through scrapy from search engine

我在学习 python 和自我发展的过程中寻求帮助,我遇到了可以获取数据的 scrapy,所以我很想知道如何通过搜索引擎完成此操作,因为例如,https://www.1mg.com/,这里我如何提取数据。

看来您没有尝试过任何东西,只是在寻找线索。但是,在 Python 中,互联网上有很多开始抓取的教程。 Scrapy 的一个好的开始可以是这个:

https://www.digitalocean.com/community/tutorials/how-to-crawl-a-web-page-with-scrapy-and-python-3

或者,由于您处于 Python 环境中,您可以查看 BeautifulSoup and Requests

由于您是数据抓取的初学者,请了解 robots.txt 文件以及必须遵守的原因。一本好书是:

https://www.promptcloud.com/blog/how-to-read-and-respect-robots-file

抓取时需要注意的其他一些道德规范:

https://www.scrapehero.com/how-to-prevent-getting-blacklisted-while-scraping/