基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于场景文本图像中背景的复杂性和文本方向的不确定性,精确定位文本位置难度加大.基于此,根据R2CNN算法对多方向文本的处理思想,提出将该思想与SSD算法相结合,即利用文本区域左上角、右上角坐标以及文本区域的高与SSD算法每一层特征层中不同纵横比的锚点框进行匹配,利用非极大值抑制筛选出最优文本框,获得文本区域.为适应场景文本,提出增添相应的锚点框纵横比,从而进行自然场景文本检测.实验结果表明,所提方法不仅可以检测出倾斜的场景文本,而且提高了SSD算法在场景文本检测时的准确性和召回率,最终准确率为0.705 6,召回率为0.534 2,F值为0.608 0.
推荐文章
基于对象建议算法的自然场景文本检测
对象建议算法
最稳定极值区域
贝叶斯分类器
自然场景文本检测
多方向自然场景文本检测
自然场景文本检测
颜色增强的最大稳定极值区域
特征提取
多方向估计
分类器
基于改进SSD的视频烟火检测算法
烟火检测
轻量化
SSD
GhostNet
Concat
特征融合
面向自然场景的中文文本检测
文本检测
特征金字塔
BAM注意力机制
可微二值化
AC Loss
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进SSD算法的自然场景文本检测
来源期刊 电视技术 学科 工学
关键词 自然场景 文本检测 深度学习 SSD算法 R2CNN算法
年,卷(期) 2019,(8) 所属期刊栏目 数字视频
研究方向 页码范围 1-9,27
页数 10页 分类号 TN911.7
字数 7088字 语种 中文
DOI 10.16280/j.videoe.2019.08.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 艾斯卡尔·艾木都拉 新疆大学信息科学与工程学院 170 561 11.0 15.0
2 阿不都萨拉木·达吾提 新疆大学信息科学与工程学院 2 0 0.0 0.0
3 孙悦 新疆大学信息科学与工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (120)
共引文献  (31)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(5)
  • 参考文献(1)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(8)
  • 参考文献(1)
  • 二级参考文献(7)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(10)
  • 参考文献(0)
  • 二级参考文献(10)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(10)
  • 参考文献(0)
  • 二级参考文献(10)
2014(11)
  • 参考文献(0)
  • 二级参考文献(11)
2015(12)
  • 参考文献(2)
  • 二级参考文献(10)
2016(8)
  • 参考文献(0)
  • 二级参考文献(8)
2017(10)
  • 参考文献(3)
  • 二级参考文献(7)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自然场景
文本检测
深度学习
SSD算法
R2CNN算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电视技术
月刊
1002-8692
11-2123/TN
大16开
北京市朝阳区酒仙桥北路乙7号(北京743信箱杂志社)
2-354
1977
chi
出版文献量(篇)
12294
总下载数(次)
21
论文1v1指导