如何使用 OCR 直接扫描网页上的图像？

How do I scan an image directly on a webpage with an OCR?

我基本上想做的是进入一个带有 selenium 的网页，并试图通过 captcha，但做得很差。我应该提到我正在使用 python 和 selenium 4 来抓取所述网页。

简而言之，这个验证码只是显示一些数字，每次我验证码失败时颜色都会改变，并且需要将这些数字写在一个框中才能通过，这似乎是一件非常简单的事情通过获得。我会附上其中一个 here, and an example of a second one after i failed the captcha here.

我只需要一个好的 OCR 即可直接在网页上读取图像而无需下载它，并存储此值以便稍后将其输入到输入框中.有什么工具可以帮助我做到这一点吗？我在网上看了一点，似乎找不到这样的东西。任何人都可以为我推荐合适的图书馆吗？如果你真的可以，如何阅读这张图片？

我建议在 Selenium 中截图：https://www.guru99.com/take-screenshot-selenium-webdriver.html#:~:text=Taking%20Screenshot%20in%20Selenium%20is,Copy%20file%20to%20Desired%20Location

然后运行通过 OCR：https://pypi.org/project/pytesseract/

如何使用 OCR 直接扫描网页上的图像？

How do I scan an image directly on a webpage with an OCR?

python

ocr

selenium

web-scraping