基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的Web数据检索一般采用全文检索方法,该方法具有很好的灵活性,但舆情分析往往需要获得相关的网页属性及统计信息.针对传统的Web检索方法无法满足上述需求,基于Hadoop平台设计并实现了一种基于多属性的海量Web数据的关联存储及检索系统,为舆情分析提供基础检索与统计服务.主要实现HDFS上基于属性的网页数据的分类和聚类存储,解决小文件存储同时提高数据访问吞吐量;建立原始网页数据与属性数据之间的关联映射;基于HBase的已有索引机制,结合分布式本地索引机制解决基于HBase的动态属性多条件选择查询的辅助索引问题.
推荐文章
基于Flink的海量医学图像检索系统设计与实现
医学图像检索
Flink
Hadoop
卷积神经网络
分布式海量文本检索系统研究
海量数据
全文检索
文本索引
海量加载
面向空间应用的数据对象存储与检索系统研究
对象存储
属性管理
HBase数据库
分段散列
一种基于海量数据的智能信息检索系统实现
信息检索
元信息
可扩展标记语言
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多属性的海量Web数据关联存储及检索系统
来源期刊 计算机工程与科学 学科 工学
关键词 分类存储 多条件选择查询 关联映射 辅助索引
年,卷(期) 2014,(3) 所属期刊栏目 高性能计算
研究方向 页码范围 404-410
页数 7页 分类号 TP391.3
字数 5680字 语种 中文
DOI 10.3969/j.issn.1007-130X.2014.03.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄永峰 清华大学电子工程系 97 583 13.0 16.0
2 李春花 华中科技大学计算机科学与技术学院 14 392 6.0 14.0
3 罗芳 华中科技大学计算机科学与技术学院 8 63 4.0 7.0
4 周可 华中科技大学计算机科学与技术学院 29 396 7.0 19.0
5 廖正霜 华中科技大学计算机科学与技术学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (213)
参考文献  (6)
节点文献
引证文献  (7)
同被引文献  (37)
二级引证文献  (17)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(4)
  • 引证文献(2)
  • 二级引证文献(2)
2018(8)
  • 引证文献(2)
  • 二级引证文献(6)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
分类存储
多条件选择查询
关联映射
辅助索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导