作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
[目的]文档图像是一类广泛存在且具有重要应用价值的数据.从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标.自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展.本文为科研人员和工程人员提供一个比较全面的文档图像识别技术总体介绍,便于大家开展技术创新和技术应用.[方法]本文在介绍文档识别应用背景的基础上,对该领域历史上主要方法进行回顾,对当前技术状况和研究动态进行分析,并展望未来发展趋势.[结果]1950年代到2000年代,在统计模式识别、特征提取、结构分析、字符切分、字符串识别和版面分析等方面积累了大量有效方法.[结论]近年来深度学习(深度神经网络)逐渐成为主导性的方法,使文字检测和识别的性能得到明显提升,但在复杂版面分析能力、文字识别的可靠性、泛化性等方面仍然存在不足.
推荐文章
农作物害虫图像识别研究进展与展望
害虫图像
虫害诊断
图像识别
深度学习
智慧农业
图像识别的关键技术与展望
图像识别
预处理
特征提取
匹配
图像识别的技术现状和发展趋势
图像识别
技术现状
发展趋势
粮虫图像识别检测技术研究现状与展望
粮情测控
图像识别
害虫检测
种群密度
粮虫防治
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文档图像识别技术回顾与展望
来源期刊 数据与计算发展前沿 学科
关键词 文档识别 版面分析 文本检测 深度学习 字符识别 文本行识别
年,卷(期) 2019,(2) 所属期刊栏目 人工智能专刊
研究方向 页码范围 17-25
页数 9页 分类号
字数 6841字 语种 中文
DOI 10.11871/jfdc.issn.2096-742X.2019.02.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘成林 中国科学院自动化研究所模式识别国家重点实验室 21 624 9.0 21.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (44)
共引文献  (50)
参考文献  (22)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(2)
  • 参考文献(1)
  • 二级参考文献(1)
1995(3)
  • 参考文献(2)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(5)
  • 参考文献(5)
  • 二级参考文献(0)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文档识别
版面分析
文本检测
深度学习
字符识别
文本行识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据与计算发展前沿
双月刊
2096-742X
10-1649/TP
大16开
北京市海淀区中关村南四街4号
2-493
2008
chi
出版文献量(篇)
135
总下载数(次)
3
总被引数(次)
9
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导