基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文字识别技术在文档管理、图像理解、视觉导航等中具有重要应用.然而,自然场景中的文字通常排列任意、形状不一、字体多样,难以被检测和识别.提出了面向自然场景图像的三阶段文字识别框架,该框架包括文字检测、文字矫正和文字识别.首先,利用特征金字塔网络分割图像中的字符,基于双向长短期记忆网络获取字符间的亲和度,连接孤立字符构建单词行,文字检测率(F分数)高达91.97%.然后,通过多目标矫正网络矫正被检测文字,以应对场景图像文字的复杂形变,增强阅读性.最后,通过注意力序列识别网络按序输出预测结果,实现单词级识别,文字识别正确率达84.98%.
推荐文章
情感教学及其三阶段论
情感
情感教学
三阶段
混合EDA求解三阶段异构并行机装配集成调度问题
集成调度
异构并行机
背包问题
分布估计算法
TSPT:基于预训练的三阶段复合式文本摘要模型
预训练
复合式文本摘要模型
抽取式方法
生成式方法
双向上下文信息词向量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向自然场景图像的三阶段文字识别框架
来源期刊 浙江大学学报(理学版) 学科 工学
关键词 文字识别 自然场景 文字检测 文字矫正
年,卷(期) 2021,(1) 所属期刊栏目 图像理解与数据分析
研究方向 页码范围 1-8
页数 8页 分类号 TP391.41
字数 语种 中文
DOI 10.3785/j.issn.1008-9497.2021.01.001
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(3)
  • 参考文献(0)
  • 二级参考文献(3)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(4)
  • 参考文献(4)
  • 二级参考文献(0)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文字识别
自然场景
文字检测
文字矫正
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(理学版)
双月刊
1008-9497
33-1246/N
大16开
杭州市天目山路148号浙江大学
32-36
1956
chi
出版文献量(篇)
3051
总下载数(次)
2
总被引数(次)
24460
论文1v1指导