基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
深度学习在图像识别的现存模型中,都有检测和识别两个过程,且需借助复杂的网络结构、大量的文本框标注来提高识别准确率.文中针对存在的问题提出了一个简单且鲁棒性强的证件图片无检测文字识别方法,通过嵌入二维特征图中不同序列位置的水平、竖直方向位置编码,将不同子空间的特征表达连接到序列解码器,解码器部分加入了全局上下文模块,网络模型能并行训练并可以快速收敛,通过插入特殊符号直接得到结构化的字段,简化了信息后处理流程,单张图片识别时间在122 ms左右.测试结果表明,模型在身份证扫描件文本图像识别上表现出优越的性能.
推荐文章
基于视觉的文字识别系统的设计与实现
模式识别
隐马氏模型
字符识别
特征提取
基于 K-means的图像文字识别与提取研究
K-means
图像文字提取
文字识别
二值化处理
基于Canny算子和Radon变换的证件图像倾斜校正
证件图像
Canny
边缘检测
Radon变换
倾斜校正
基于二叉树相似性检测的变形文字识别研究
文字识别
分枝特征
树型相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Transformer的证件图像无检测文字识别
来源期刊 信息技术 学科
关键词 Transformer 端到端模型 无检测文字识别 全局上下文 二维位置编码
年,卷(期) 2021,(6) 所属期刊栏目 研究与探讨|RESEARCH AND DISCUSSION
研究方向 页码范围 78-85,90
页数 9页 分类号 TP391
字数 语种 中文
DOI 10.13274/j.cnki.hdzj.2021.06.015
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (100)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Transformer
端到端模型
无检测文字识别
全局上下文
二维位置编码
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术
月刊
1009-2552
23-1557/TN
大16开
哈尔滨市南岗区黄河路122号
14-36
1977
chi
出版文献量(篇)
11355
总下载数(次)
31
总被引数(次)
47901
论文1v1指导