标题:基于窗口注意力机制的文本超分辨率方法 作者:舒琪1,2 王旭智1,2 万旺根1,2 作者单位:1 上海大学通信与信息工程学院,上海 200072;2 上海大学智慧城市研究院,上海 200072 关键字:超分辨率重建;文本识别;深度学习 摘要:自然场景下文本图像往往具有复杂且多样化的背景,由于拍摄条件的限制,这些图像可能存在模糊、昏暗或低分辨率等问题,给文本识别任务带来了挑战。为了提高文字区域的清晰度并提升文字识别的准确性,提出了文本超分辨率网络TSSRN。该算法在文本超分辨率网络TBSRN的基础上引入了Swin Transformer,以感知更多层次的特征信息。此外,还引入了边缘损失函数增强纹理结构特征。最后在TextZoom数据集上进行训练和测试,实验结果表明,该方法在文本图像超分辨率重建的细节清晰度方面取得了一定的提升,相较于原TBSRN算法也有所提高,从而验证了算法的有效性。 |