Python OCR Tesseract 无法识别单个字符

Python OCR Tesseract cannot recognize Single Characters

我有两张 TIF 图片。第一张图片(a.tif)是:

第二张图片(bcd.tif)是

当我使用 "tesseract a.tif a.txt" 时,它没有读取那个字符和相同的命令 "tesseract bcd.tif bcd.txt" 是 working.I 在 Whosebug 中看到了一些答案,他们没有给出如何 运行 that.If 的解决方案我们需要添加任何参数,这些参数是什么?

问题似乎与图像中只有一个字符有关。例如,我尝试了这两张图片:

这个很好用。 Tesseract 报告结果置信度为 95%:

这个不行。

我也尝试过将 PageSegMode 设置为 SingleChar 来扫描该图像,然后扫描正常。

命令行参数应该是-psm 10。看到这个:

如您所说,您需要将模式更改为单字符模式,您可以在 python 中使用以下命令

pytesseract.image_to_string(img_path , config="--psm 10")