Python OCR Tesseract 无法识别单个字符

Question

我有两张 TIF 图片。第一张图片（a.tif）是：

第二张图片（bcd.tif）是

当我使用 "tesseract a.tif a.txt" 时，它没有读取那个字符和相同的命令 "tesseract bcd.tif bcd.txt" 是 working.I 在 Whosebug 中看到了一些答案，他们没有给出如何运行 that.If 的解决方案我们需要添加任何参数，这些参数是什么？

Answer 1

问题似乎与图像中只有一个字符有关。例如，我尝试了这两张图片：

这个很好用。 Tesseract 报告结果置信度为 95%：

这个不行。

我也尝试过将 PageSegMode 设置为 SingleChar 来扫描该图像，然后扫描正常。

命令行参数应该是-psm 10。看到这个：

Answer 2

如您所说，您需要将模式更改为单字符模式，您可以在 python 中使用以下命令

pytesseract.image_to_string(img_path , config="--psm 10")

Python OCR Tesseract 无法识别单个字符

Python OCR Tesseract cannot recognize Single Characters

python

ocr

python-tesseract