原文服务方: 计算机应用研究       
摘要:
针对背景复杂或者存在字符黏连时文本段图片无法准确切分的情况进行了研究,提出了一种复杂场景文本段识别方法.该方法利用图像和文字序列的相关性设计双向递归神经网络对图像特征序列进行编码,然后设计集成的连接时间分类(CTC)和注意力(attention)模块对编码特征进行解码输出.该算法在多个数据集(公开数据集ICDAR2013和ICDAR2003以及验证码数据集)上进行测试,得到识别准确率分别为90.2%、87.4%和92.5%,从而证明了该算法的有效性.实验结果对文本段识别和应用有重要意义.
推荐文章
基于梯度向量的复杂场景文本定位
文本处理
视频文本检测
加权平均梯度能量
运动能量
梯度向量
面向复杂场景图像的文本定位新方法
MLP网络
多层感知器
投影
区域分析
在复杂场景中多目标物的检测识别方法
矩阵码
目标识别
拐角点提取
透视变换
图像匹配
多方向自然场景文本检测
自然场景文本检测
颜色增强的最大稳定极值区域
特征提取
多方向估计
分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 复杂场景文本段识别
来源期刊 计算机应用研究 学科
关键词 文本段识别 连接时间分类 注意力 集成
年,卷(期) 2019,(9) 所属期刊栏目 图形图像技术
研究方向 页码范围 2818-2820,2844
页数 4页 分类号 TP391.41
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.03.0230
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张利 清华大学电子工程系 166 1426 18.0 35.0
2 王孝男 清华大学电子工程系 1 0 0.0 0.0
3 何思楠 清华大学电子工程系 2 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (11)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本段识别
连接时间分类
注意力
集成
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导