如何使用 OCR 直接扫描网页上的图像?

How do I scan an image directly on a webpage with an OCR?

我基本上想做的是进入一个带有 selenium 的网页,并试图通过 captcha,但做得很差。我应该提到我正在使用 pythonselenium 4 来抓取所述网页。

简而言之,这个验证码只是显示一些数字,每次我验证码失败时颜色都会改变,并且需要将这些数字写在一个框中才能通过,这似乎是一件非常简单的事情通过获得。我会附上其中一个 here, and an example of a second one after i failed the captcha here.

我只需要一个好的 OCR 即可直接在网页上读取图像而无需下载它,并存储此值以便稍后将其输入到输入框中.有什么工具可以帮助我做到这一点吗?我在网上看了一点,似乎找不到这样的东西。任何人都可以为我推荐合适的图书馆吗?如果你真的可以,如何阅读这张图片?

我建议在 Selenium 中截图:https://www.guru99.com/take-screenshot-selenium-webdriver.html#:~:text=Taking%20Screenshot%20in%20Selenium%20is,Copy%20file%20to%20Desired%20Location

然后 运行 通过 OCR:https://pypi.org/project/pytesseract/