离线识别
脱机手写识别涉及将图像中的文本自动转换为可在计算机和文本处理应用程序中使用的字母代码。通过这种形式获得的数据被视为笔迹的静态表示。离线手写识别相对困难,因为不同的人具有不同的手写风格。并且,到目前为止,OCR引擎主要集中于机器打印的文本和手工“打印”文本的ICR。
传统技术字符提取
脱机字符识别通常涉及扫描过去某个时候编写的表格或文档。这意味着需要提取扫描图像中包含的各个字符。存在能够执行此步骤的工具。但是,此步骤中存在几个常见的缺陷。最常见的情况是,将连接的字符作为包含两个字符的单个子图像返回时。这在识别阶段引起了主要问题。还有许多降低连接字符风险的算法。
字符识别
提取单个字符后,将使用识别引擎来识别相应的计算机字符。当前有几种不同的识别技术。
特征提取
特征提取的工作方式与神经网络识别器类似。但是,程序员必须手动确定他们认为重要的属性。这种方法使识别器可以更好地控制识别中使用的属性。但是,使用这种方法的任何系统都比神经网络需要更多的开发时间,因为不会自动学习特性。
现代技术
传统技术着重于对单个字符进行分割以进行识别,而现代技术着重于识别经分割的文本行中的所有字符。特别地,他们专注于能够学习视觉特征的机器学习技术,从而避免了先前使用的有限特征工程。最先进的方法使用卷积网络来提取文本行图像的多个重叠窗口上的视觉特征,RNN使用这些窗口来产生字符概率。
在线识别
在线手写识别涉及在特殊的数字化仪或PDA上书写时自动转换文本,在此传感器会拾取笔尖的移动以及上/下笔切换。这种数据称为数字墨水,可以视为手写的数字表示。所获得的信号被转换为可在计算机和文本处理应用程序中使用的字母代码。
在线手写识别界面的元素通常包括:
供用户使用的笔或手写笔。触敏表面,其可以与输出显示器集成在一起或与其相邻。一个软件应用程序,用于解释手写笔在书写面上的移动,并将生成的笔划转换为数字文本。问题是离线识别。研究手写识别拥有活跃的学术研究社区。xxx的手写识别会议是在偶数年举行的国际手写识别领域国际会议(ICFHR)和在奇数年举行的国际文档分析和识别会议(ICDAR)。这两个会议均得到IEEE和IAPR的认可。研究的活跃领域包括:
在线识别离线识别签名验证邮政地址解释银行支票处理作家认可