基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在PDF的各种应用中,对于文档的理解与处理是非常重要的.首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档.因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出来,经过组织后,保存在称为KIU的文件中,这样可以在实际上不接触PDF文件的情况下,自动生成超链接.分区域的方法有利于提取过程,找到文本的位置和范围后,可以借助于光学字符识别(OCR)软件来提取文本中的关键性词语或词组.
推荐文章
基于TF*PDF的热点关键短语提取
TF*PDF
TDT
提取
脉冲值
关键词短语
粉末衍射文件(PDF)的简况与使用
X射线粉末衍射
数据库
检索软件
物相定性分析
PDF文件链接信息提取与修改
Plug-in插件
Adobe portable document format (PDF) 航空规章
基于TF*PDF的热点关键短语提取
TF*PDF
TDT
提取
脉冲值
关键词短语
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 PDF文件中关键信息的提取与组织方法研究
来源期刊 计算机工程与设计 学科 工学
关键词 PDF文件 关键信息 文本提取 标准通用置标语言 超链接
年,卷(期) 2007,(7) 所属期刊栏目 计算机应用
研究方向 页码范围 1688-1690
页数 3页 分类号 TP391.1
字数 3661字 语种 中文
DOI 10.3969/j.issn.1000-7024.2007.07.062
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘立柱 解放军信息工程大学信息工程学院 18 183 7.0 13.0
2 丁志鸿 解放军信息工程大学信息工程学院 3 25 3.0 3.0
3 陈云榕 解放军信息工程大学信息工程学院 1 15 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (30)
参考文献  (6)
节点文献
引证文献  (15)
同被引文献  (24)
二级引证文献  (43)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(3)
  • 参考文献(3)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(5)
  • 引证文献(4)
  • 二级引证文献(1)
2014(11)
  • 引证文献(4)
  • 二级引证文献(7)
2015(8)
  • 引证文献(3)
  • 二级引证文献(5)
2016(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(7)
  • 引证文献(0)
  • 二级引证文献(7)
2018(7)
  • 引证文献(1)
  • 二级引证文献(6)
2019(8)
  • 引证文献(0)
  • 二级引证文献(8)
研究主题发展历程
节点文献
PDF文件
关键信息
文本提取
标准通用置标语言
超链接
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导