基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来微博炒作账户异军突起,采用违规手段开展网络公关活动,严重扰乱了正常的互联网秩序.传统的炒作账户发现主要采用特征分析方法,忽视了炒作账户的组织性和策划性,难以发现隐蔽性高的炒作账户.针对以上问题,充分考虑到炒作账户共同参与微博炒作的群体特性,将炒作群体发现问题转化为挖掘最大频繁项集问题,提出了一种基于最大频繁项集挖掘的炒作群体发现方法,能够找出多次共同参与炒作微博传播的账户群体.为了提高最大频繁项集挖掘的效率,结合研究背景以及事务数据库的特点,提出了一种基于迭代交集的最大频繁项集发现算法,采用基于二分查找的最大频繁候选项集筛选策略对事务数据库进行缩减,并利用多种方式减少事务间取交集的次数.最后通过实验对IIA算法的性能进行了评估,并在真实的新浪微博数据集上验证了炒作群体发现方法的有效性,实验结果表明利用该方法发现的炒作群体准确率高于90%,而且能发现传统特征分析方法难以识别的隐蔽炒作账户.
推荐文章
基于图论的最大频繁项集挖掘
数据挖掘
关联规则
最大频繁项集
有向项集图
三叉链表式存储结构
挖掘算法
快速挖掘最大频繁项集
数据挖掘
关联规则
最大频繁项集
频繁模式矩阵
最大频繁项集的高效挖掘
数据挖掘
关联规则
最大频繁项集
频繁模式树
频繁模式矩阵
基于B-list的最大频繁项集挖掘算法
最大频繁项集挖掘
深度优先搜索
剪枝技术
超集检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最大频繁项集挖掘的微博炒作群体发现方法
来源期刊 计算机工程与应用 学科 工学
关键词 数据挖掘 微博 炒作群体 最大频繁项集
年,卷(期) 2017,(4) 所属期刊栏目 大数据与云计算
研究方向 页码范围 90-97
页数 8页 分类号 TP391
字数 10099字 语种 中文
DOI 10.3778/j.issn.1002-8331.1507-0176
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘琰 12 17 3.0 4.0
2 张进 3 14 2.0 3.0
3 陈静 5 0 0.0 0.0
4 尹美娟 3 35 2.0 3.0
5 张伟丽 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (192)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
微博
炒作群体
最大频繁项集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导