标题:基于表格识别的餐饮业进出货台账图片识别方法 作者:汪浩 作者单位:上海大学通信与信息工程学院,上海 200444 关键字:表格识别;DBNet;SPIN;TableMaster;台账;餐饮业 摘要:针对当前表格识别算法对于餐饮业进出货台账图片在自然场景情况下文本和表格识别能力弱的问题,在参考以往表格识别算法架构基础上,提出了一种基于改进的DBNet文本检测算法、SPIN场景文本识别算法与TableMaster表格识别算法的台账图片表格识别算法。改进的DBNet文本检测算法在DBNet算法的特征提取网络中引入了自适应尺度融合模块ASF,有效提升了文本定位能力;采用SPIN场景文本识别算法代替CRNN识别算法,增强了其对自然场景中倾斜、模糊、扭曲文本的识别能力;采用TableMaster识别算法代替PLANet表格识别算法,增强了在轻量化条件下的识别能力和准确度。将文本检测与表格识别模型联合串联推理,在测试场景下达到了94.7%的识别率,具有较高的实用价值。 |