基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
将图片切分成单"字"识别再连接成"串"是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现.卷积循环神经网络(CRNN)虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,网络提取出的特征表示力不够.对此提出了加强型卷积块注意力模块和复合卷积,并将其加入处理脱机文本识别的CRNN+CTC主流框架中.加强型卷积块注意力模块增大输入特征图的贡献权重且并联地使用通道注意力、空间注意力,丰富了细化特征图语义信息的同时避免了通道注意力模块对空间注意力模块的权重干扰,使得网络更聚焦图片中的有用特征而非无用的拖拽字迹特征.而嵌入在网络深层的复合卷积采用的多卷积核卷积意味着不同尺度的特征融合,增强了网络的泛化性.基于加强型卷积块注意力模块和复合卷积的CRNN+CTC框架在具有语义信息的IAM数据集上准确率达到85.7748%,字符错误率为8.6%;在RIMES数据集上准确率达到92.8728%,字符错误率为3.9%,比起当前主流的脱机文本识别算法,性能进一步提升.
推荐文章
基于卷积注意力机制和多损失联合的跨模态行人重识别
跨模态行人重识别
深度学习
卷积注意力机制
多损失联合
基于混合式注意力机制的语音识别研究
卷积
注意力机制
全局平均池化
长短期记忆网络
LAS模型
基于多尺度融合注意力机制的人脸表情识别研究
计算机视觉
深度学习
人脸表情识别
特征提取
多尺度特征融合
注意力机制
多注意力机制下自愈人脸表情识别
人脸表情识别多
注意力机制
自愈
不确定性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 注意力机制与复合卷积在手写识别中的应用
来源期刊 计算机科学与探索 学科 工学
关键词 脱机英文手写单词识别 加强型卷积块注意力模块 复合卷积 卷积循环神经网络(CRNN)
年,卷(期) 2022,(4) 所属期刊栏目 人工智能|Artificial Intelligence
研究方向 页码范围 888-897
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.2010094
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
脱机英文手写单词识别
加强型卷积块注意力模块
复合卷积
卷积循环神经网络(CRNN)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
相关基金
江苏省自然科学基金
英文译名:Natural Science Foundation of Jiangsu Province
官方网址:http://www.jsnsf.gov.cn/News.aspx?a=37
项目类型:
学科类型:
论文1v1指导