基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 在文档图像版面分析上,主流的深度学习方法克服了传统方法的缺点,能够同时实现文档版面的区域定位与分类,但大多需要复杂的预处理过程,模型结构复杂.此外,文档图像数据不足的问题导致文档图像版面分析无法在通用的深度学习模型上取得较好的性能.针对上述问题,提出一种多特征融合卷积神经网络的深度学习方法.方法 首先,采用不同大小的卷积核并行对输入图像进行特征提取,接着将卷积后的特征图进行融合,组成特征融合模块;然后选取DeeplabV3中的串并行空间金字塔策略,并添加图像级特征对提取的特征图进一步优化;最后通过双线性插值法对图像进行恢复,完成文档版面目标,即插图、表格、公式的定位与识别任务.结果 本文采用mIOU (mean intersection over union)以及PA (pixel accuracy)两个指标作为评价标准,在ICDAR 2017 POD文档版面目标检测数据集上的实验表明,提出算法在mIOU与PA上分别达到87.26%和98.10%.对比FCN(fully convolutional networks),提出算法在mIOU与PA上分别提升约14.66%和2.22%,并且提出的特征融合模块对模型在mIOU与PA上分别有1.45%与0.22%的提升.结论 本文算法在一个网络框架下同时实现了文档版面多种目标的定位与识别,在训练上并不需要对图像做复杂的预处理,模型结构简单.实验数据表明本文算法在训练数据较少的情况下能够取得较好的识别效果,优于FCN和DeeplabV3方法.
推荐文章
基于多特征融合的图像语义标注
基于内容的图像检索
多特征融合
支持向量机
图像语义标注
彩色文档图像的版面分析
文档图像
版面分析
连通元
归一
多特征融合的图形图像分类算法
图像分类
色彩管理
渲染目的
一种图像分类的多特征vague融合模型
信息融合
模糊集
维数灾难
隶属函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多特征融合的文档图像版面分析
来源期刊 中国图象图形学报 学科 工学
关键词 文档图像处理 版面分析 目标检测 深度学习 语义分割
年,卷(期) 2020,(2) 所属期刊栏目 图像分析和识别
研究方向 页码范围 311-320
页数 10页 分类号 TP391.4
字数 6990字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 应自炉 五邑大学智能制造学部 55 346 8.0 16.0
2 邓文博 五邑大学智能制造学部 2 1 1.0 1.0
3 赵毅鸿 五邑大学智能制造学部 3 1 1.0 1.0
4 宣晨 五邑大学智能制造学部 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文档图像处理
版面分析
目标检测
深度学习
语义分割
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国图象图形学报
月刊
1006-8961
11-3758/TB
大16开
北京9718信箱
82-831
1996
chi
出版文献量(篇)
5906
总下载数(次)
17
总被引数(次)
131816
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导