基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对如何尽早地获取电商网站中产品的评论信息,进而实时地把握产品舆情,提出了一种基于Storm的在线产品评论信息采集方法.该方法将流计算的概念应用于网络爬虫中,并通过SHHD算法对采集周期进行动态调整.实验结果表明:基于Storm平台进行信息采集具有吞吐量大、可扩展性强等优点;SHHD算法可以有效地降低采集系统对网络带宽和系统资源的消耗,实现了适应性的增量的在线产品评论信息采集过程;SHHD在产品的评论信息获取的滞后时间上较Poisson、SART等方法具有明显的优势.
推荐文章
基于语义查询扩展的产品评论检索
词项相关度
评论检索
语义扩展
基于领域本体对生鲜产品评论的"特征观点对"识别
生鲜在线评论
领域本体
特征观点对
产品评论挖掘研究综述
用户评论
主观特征
词语极性
互联网产品评论信息中垃圾评论的识别方法浅析
产品评论
垃圾评论检测
评论内容
用户行为
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于Storm的在线产品评论信息采集的方法
来源期刊 广东工业大学学报 学科 工学
关键词 产品评论信息 Storm 适应性 增量采集
年,卷(期) 2017,(3) 所属期刊栏目
研究方向 页码范围 83-88
页数 6页 分类号 TP391
字数 4314字 语种 中文
DOI 10.12052/gdutxb.170042
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郝志峰 广东工业大学计算机学院 166 940 14.0 20.0
2 蔡瑞初 广东工业大学计算机学院 66 279 10.0 13.0
3 温雯 广东工业大学计算机学院 48 272 10.0 14.0
4 袁琴 广东工业大学计算机学院 2 4 1.0 2.0
5 骆魁永 广东工业大学计算机学院 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (55)
共引文献  (69)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (8)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(6)
  • 参考文献(1)
  • 二级参考文献(5)
2004(10)
  • 参考文献(0)
  • 二级参考文献(10)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
产品评论信息
Storm
适应性
增量采集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广东工业大学学报
双月刊
1007-7162
44-1428/T
16开
广东省广州市东风东路729号
1974
chi
出版文献量(篇)
2262
总下载数(次)
2
总被引数(次)
11966
论文1v1指导