Python OCR Tesseract 无法识别单个字符
Python OCR Tesseract cannot recognize Single Characters
我有两张 TIF 图片。第一张图片(a.tif)是:
第二张图片(bcd.tif)是
当我使用 "tesseract a.tif a.txt" 时,它没有读取那个字符和相同的命令 "tesseract bcd.tif bcd.txt" 是 working.I 在 Whosebug 中看到了一些答案,他们没有给出如何 运行 that.If 的解决方案我们需要添加任何参数,这些参数是什么?
问题似乎与图像中只有一个字符有关。例如,我尝试了这两张图片:
这个很好用。 Tesseract 报告结果置信度为 95%:
这个不行。
我也尝试过将 PageSegMode 设置为 SingleChar 来扫描该图像,然后扫描正常。
命令行参数应该是-psm 10
。看到这个:
如您所说,您需要将模式更改为单字符模式,您可以在 python 中使用以下命令
pytesseract.image_to_string(img_path , config="--psm 10")
我有两张 TIF 图片。第一张图片(a.tif)是:
第二张图片(bcd.tif)是
当我使用 "tesseract a.tif a.txt" 时,它没有读取那个字符和相同的命令 "tesseract bcd.tif bcd.txt" 是 working.I 在 Whosebug 中看到了一些答案,他们没有给出如何 运行 that.If 的解决方案我们需要添加任何参数,这些参数是什么?
问题似乎与图像中只有一个字符有关。例如,我尝试了这两张图片:
这个很好用。 Tesseract 报告结果置信度为 95%:
这个不行。
我也尝试过将 PageSegMode 设置为 SingleChar 来扫描该图像,然后扫描正常。
命令行参数应该是-psm 10
。看到这个:
如您所说,您需要将模式更改为单字符模式,您可以在 python 中使用以下命令
pytesseract.image_to_string(img_path , config="--psm 10")