识别用符号书写的字母
Recognize letters written with symbols
我有一个非常规的问题,我想不出解决的方法。我有一些信是这样写的:
/\ |---\ /---\
/ \ |___/ |
/----\ | \ |
/ \ |___/ \---/
现在,我们的想法是读取此内容(可能来自文本文件)并将其解析为它们实际代表的真实字母。所以这应该被解析为 ABC
。
我知道这不是 OCR,但我不知道这样的事情是否可行。我不是在寻求解决方案,而是您如何最好地解决这个问题?区分 'letter' 何时开始和何时结束的良好标准是什么?
我仍然会将其视为 OCR 类问题。
您可以先将字符绘制到图像上,然后 运行 通过可用的 OCR 库。
或者你可以自己做。
通过先将垂直和水平字符转换为行来对其进行预处理。
然后在有正斜杠和反斜杠的地方,通过它们与之前的水平和垂直相交的位置来近似曲线的起点和终点(对于 'o' 或 [=23 等字母,需要不同的方法=]).
有了这张图片后,简单的模式分析方法(例如朴素贝叶斯)应该能够产生可靠的结果。
预处理是否真的会提高准确性,我不确定
根据评论,听起来您可以存储字符字体映射(每个字符的二维数组),然后读取输入文件并缓冲等于字符高度的行数。
然后,对于每组行,您可能希望根据字符的宽度对输入进行分段并水平滑动,寻找与您的字体映射匹配的内容。
如果您需要支持多种字体,那么事情会变得更加复杂,您将从神经网络方法中获益更多,以进行各种字符识别。
关于 OCR 通常如何工作,需要牢记的一个重要方面是它采用任意图像并 "pixelates" 生成分辨率低得多的图像。在您的情况下,您已经获得了图像的 "pixelated" 表示,您所要做的就是读取输入并将其馈送到管道的其余部分。
我有一个非常规的问题,我想不出解决的方法。我有一些信是这样写的:
/\ |---\ /---\
/ \ |___/ |
/----\ | \ |
/ \ |___/ \---/
现在,我们的想法是读取此内容(可能来自文本文件)并将其解析为它们实际代表的真实字母。所以这应该被解析为 ABC
。
我知道这不是 OCR,但我不知道这样的事情是否可行。我不是在寻求解决方案,而是您如何最好地解决这个问题?区分 'letter' 何时开始和何时结束的良好标准是什么?
我仍然会将其视为 OCR 类问题。
您可以先将字符绘制到图像上,然后 运行 通过可用的 OCR 库。
或者你可以自己做。 通过先将垂直和水平字符转换为行来对其进行预处理。
然后在有正斜杠和反斜杠的地方,通过它们与之前的水平和垂直相交的位置来近似曲线的起点和终点(对于 'o' 或 [=23 等字母,需要不同的方法=]).
有了这张图片后,简单的模式分析方法(例如朴素贝叶斯)应该能够产生可靠的结果。
预处理是否真的会提高准确性,我不确定
根据评论,听起来您可以存储字符字体映射(每个字符的二维数组),然后读取输入文件并缓冲等于字符高度的行数。
然后,对于每组行,您可能希望根据字符的宽度对输入进行分段并水平滑动,寻找与您的字体映射匹配的内容。
如果您需要支持多种字体,那么事情会变得更加复杂,您将从神经网络方法中获益更多,以进行各种字符识别。
关于 OCR 通常如何工作,需要牢记的一个重要方面是它采用任意图像并 "pixelates" 生成分辨率低得多的图像。在您的情况下,您已经获得了图像的 "pixelated" 表示,您所要做的就是读取输入并将其馈送到管道的其余部分。