2018年度  第11期


标题:基于自然场景的OCR自动纠错系统
作者:代雅俊 沈俊杰
作者单位:上海大学机电工程与自动化学院,上海 200072
关键字:文字识别,卷积神经网络,循环神经网络,时间联结分类器,二元语言模型
摘要:光学字符识别一直以来是计算机视觉领域的重要研究课题。如何进一步提高其在自然场景下的识别率是当前所面临的重大挑战。因此,提出了一个基于自然场景OCR自动纠错系统。首先构建了一个端到端的深度神经网络模型,该模型将特征提取、序列建模、序列转换集成到一个统一的框架,并可以进行端到端的训练。接着建立了一个二元语言模型,将深度神经网络模型输出的文字序列进行处理以达到自动纠错的目的。实验结果分析表明,该套系统在MJSynth数据集下有着非常高的识别率。