作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
通过Lucene API和PDFBox API实现对PDF文档的二次全文检索.为了实现精确的搜索了一种新的二次索引算法,该二次索引带有关键词的页码、坐标及其上下文等信息.利用该二次索引可将检索结果定位到PDF文档的具体页,然后在页面上标示出关键字的具体位置,使对PDF文档的二次检索达到了类似百度文库的全文检索效果.
推荐文章
基于Lucene全文检索引擎的应用研究
全文检索引擎
索引
Lucene
全文检索引擎Lucene系统模型与应用研究
全文检索
Lucene
倒排索引
分词
Lucene的全文检索的研究与应用
全文检索
Lucene
索引
基于Lucene的全文检索引擎研究与应用
全文检索
索引
应用研究/Lucene
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Lucene全文检索应用研究
来源期刊 微计算机应用 学科 工学
关键词 全文检索 二次索引 二次检索 Lucene
年,卷(期) 2011,(2) 所属期刊栏目 软件与硬件的应用与开发
研究方向 页码范围 62-65
页数 分类号 TP391.3
字数 1171字 语种 中文
DOI 10.3969/j.issn.2095-347X.2011.02.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴代文 渭南师范学院传媒工程系 42 90 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (5)
同被引文献  (8)
二级引证文献  (6)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
全文检索
二次索引
二次检索
Lucene
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络新媒体技术
双月刊
2095-347X
10-1055/TP
大16开
北京海淀区北四环西路21号
2-304
1980
chi
出版文献量(篇)
3082
总下载数(次)
5
总被引数(次)
15965
论文1v1指导