使用 python 和 scrapy 从网站提取电子邮件和 phone 号码

Extract email and phone numbers from website using python and scrapy

我有一个包含数千个网站的列表,如果可用,我想提取 phone 个号码和电子邮件。 可能使用 python + scrapy

我找到了这个 https://levelup.gitconnected.com/scraping-websites-for-phone-numbers-and-emails-with-python-5557fcfa1596

但似乎该软件包不再可用。 有什么建议么? 谢谢!

这是一个广泛的问题,所以我不能在这里完全回答。

基本上,您需要按照以下步骤操作:

  • 首先,使用 BS4 或 Scrapy 抓取网站 HTML。
  • 然后使用一些正则表达式查找电子邮件,phone 个数字

另请查看这篇文章:https://www.geeksforgeeks.org/email-id-extractor-project-from-sites-in-scrapy-python/