基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着信息化技术飞速发展,爆炸性数据的增长以及数据的多样化给大数据检索带来了挑战.MapReduce作为一种并行处理框架,在大数据处理上具有明显优势.为此,结合概念格的相关知识,采用形式概念分析发现文档之间的关系并用格进行表示,提出一种新型的支持大规模文本检索的形式概念索引结构,给出基于MapReduce框架建立概念索引的相关算法.通过与Lucene索引进行比较,验证了所提索引的有效性.实验结果表明,将文档之间关系采用概念格表示并建立概念索引,能够提高大规模文本检索的性能.
推荐文章
内嵌空间排序支持向量机及其在文本检索中的应用
排序学习
支持向量机
文本检索
特征选择
基于本体的企业文本检索模型研究
文本检索
文本分析
本体描述符
自然段
分布式大规模文本检索系统
分布式系统
文本检索
域信息
TREC 2006
基于向量空间模型的文本检索系统
向量空间模型
VSM
文本检索
信息获取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MapReduce环境下支持大规模文本检索的概念索引
来源期刊 计算机工程 学科 工学
关键词 大数据 MapReduce框架 数据检索 形式概念分析 概念格 概念索引
年,卷(期) 2015,(7) 所属期刊栏目 先进计算与数据处理
研究方向 页码范围 48-54
页数 7页 分类号 TP18
字数 6985字 语种 中文
DOI 10.3969/j.issn.1000-3428.2015.07.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张生 上海理工大学光电信息与计算机工程学院 31 114 6.0 9.0
2 胡加靖 上海理工大学光电信息与计算机工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (4)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (8)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
大数据
MapReduce框架
数据检索
形式概念分析
概念格
概念索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导