提取图像的轮廓位置和方向

Extraction of contour positions and orientations of an image

我基本上是在关注一篇论文,“使用统计语言模型来提高基于 HMM 的草书手写识别系统的性能”。

这里作者从每一次滑动中提取了一个包含9个特征的向量window。引用论文:

The first three features are the weight of the window, its centre of gravity and the second order moment of the window.

Features four and five define the position of the upper and lower contour in the window, features six and seven give the orientation of the upper and lower contour by the gradient of the contour at the windows position, feature eight gives the number of black to white transitions in vertical direction, while feature nine gives the number of black pixels between the upper and lower contour.

我设法计算出了论文中提到的前三个特征,但我似乎无法理解特征 4、5、6、7、8。

我可以计算图像的轮廓。假设,这是其中一个文本行的 window(windows 长度为 14 像素,如论文所建议):

这是图像的提取轮廓:

那么这里的上下轮廓到底是什么?我可以从哪里考虑限制,如果它指的是顶部和底部像素,那么我可以在没有轮廓提取的情况下提取那些?同样,这些轮廓的方向同样令人困惑。

非常感谢您的指导。

我看了看论文,我很确定 "upper" 和 "lower" 应该读作 "uppest" 和 "lowest"。这尤其有意义,因为作者特别关注他们在水平和垂直方向上标准化的数据的预处理。他们注意具有一种对缩放、书写角度的鲁棒性,...

我想特征 4 和 5 可以是轮廓的极值坐标,结合特征 6 和 7,即梯度 = 方向,可以很好地了解轮廓这些部分的形状。

特征 9,我猜主要用于区分具有相似垂直形状的字母,例如 "i"、"l"、"j".

这是我的理解。希望这对您有所帮助!