基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对在大规模数据库中挖掘高效用模式产生大量基于内存的效用模式树,从而导致内存空间占用较大以及丢失一些高效用项集的问题,提出在Hadoop分布式计算平台下的基于聚类划分的高效用模式并行挖掘算法PUCP.首先,采用聚类的方法把数据库中相似的事务划分为若干数据子集;然后,把若干划分好的数据子集分配到Hadoop平台的各个节点中构造效用模式树;最后,把各个节点中相同项的条件模式基分配到同一个节点中进行挖掘,以减少各个节点交叉操作的次数.通过实验结果和理论分析表明:PUCP算法在不影响挖掘结果可靠性的前提下,与主流串行高效用模式挖掘——效用模式增长挖掘算法(UP-Growth)和现有的并行高效用模式挖掘算法PHUI-Growth相比,挖掘效率分别提高了61.2%和16.6%;并且使用了Hadoop计算平台,能有效缓解挖掘大规模数据的内存压力.
推荐文章
基于MapReduce的top-k高效用模式挖掘算法
数据挖掘
top-k
高效用模式
MapReduce
并行算法
机群系统上基于映射和抽样划分的并行聚类算法
聚类
并行算法
机群系统
映射
抽样
划分
一种快速挖掘top-k高效用模式的算法
高效用模式
top-k模式挖掘
效用挖掘
数据挖掘
基于划分的数据挖掘K-means聚类算法分析
数据挖掘
聚类分析
K-means聚类算法
聚类中心选取
K-means算法改进
初始中心点
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于聚类划分的高效用模式并行挖掘算法
来源期刊 计算机应用 学科 工学
关键词 大数据 高效用模式挖掘 聚类 并行计算 Hadoop
年,卷(期) 2016,(8) 所属期刊栏目 先进计算
研究方向 页码范围 2202-2206,2212
页数 6页 分类号 TP301.6
字数 4411字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.08.2202
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (7)
节点文献
引证文献  (24)
同被引文献  (91)
二级引证文献  (43)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(10)
  • 引证文献(9)
  • 二级引证文献(1)
2018(15)
  • 引证文献(8)
  • 二级引证文献(7)
2019(31)
  • 引证文献(7)
  • 二级引证文献(24)
2020(11)
  • 引证文献(0)
  • 二级引证文献(11)
研究主题发展历程
节点文献
大数据
高效用模式挖掘
聚类
并行计算
Hadoop
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导