作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程.用Tika获取文档的元数据以及文档内容的文本提取.用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点.利用Spring MVC实现搜索服务的Web访问处理.可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务.在该论文研究基础上可建立个性化的内容搜索服务系统.
推荐文章
支持基于内容检索的媒体语义特征分析平台
基于内容检索
媒体语义
特征分析
平台
基于语义网的电子政务文档检索技术的实现
电子政务文档
检索
语义网
资源描述框架
一种基于文档内容的语义标注方法
本体
语义网
语义标注
文档
基于音频内容的语义级场景检索
隐马尔可夫
支持向量机
Viterbi算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Tika语义分析的文档内容检索服务研究
来源期刊 井冈山大学学报(自然科学版) 学科 工学
关键词 Spring MVC Lucene Tika 文档元数据 全文检索
年,卷(期) 2013,(2) 所属期刊栏目
研究方向 页码范围 60-64
页数 分类号 TP393
字数 2396字 语种 中文
DOI 10.3969/j.issn.1674-8085.2013.02.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 丁振凡 华东交通大学信息工程学院 78 440 12.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (24)
共引文献  (173)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (8)
二级引证文献  (2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(10)
  • 参考文献(7)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Spring MVC
Lucene
Tika
文档元数据
全文检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
井冈山大学学报(自然科学版)
双月刊
1674-8085
36-1309/N
大16开
江西省吉安市青原区
2010
chi
出版文献量(篇)
2946
总下载数(次)
3
论文1v1指导