原文服务方: 西安交通大学学报       
摘要:
针对传统的分布式全局频繁项目集挖掘算法存在大量的候选项目集,且求全局频繁项目集的网络通信代价过高等问题,提出了一种分布式数据库的全局频繁项目集快速挖掘算法(FDMA).该算法改进了频繁模式树(FP-树)的结构,将双向FP-树改为单向,每个节点只保留指向父结点的指针,减少了指针数,由此可节省1/3的树空间;同时通过传送用3个很小的数组表示的被约束子树 ,在此挖掘全局频繁项目集的过程中不再生成大量候选项目集或条件FP-树,从而减小了网络通信量,提高了挖掘效率.实验表明, 所提算法的挖掘速度比传统的分布式数据库数据挖掘算法至少提高了1倍之多,随着数据库规模的增大,它的扩展性将更好.
推荐文章
基于项编码的分布式频繁项集挖掘算法
频繁项集挖掘
Apriori算法
大数据
分布式计算
一种频繁项目集的快速挖掘算法
数据挖掘
关联规则
频繁项目集
双向搜索
分布式全局最大频繁项集挖掘算法
数据挖掘
关联规则
分布式挖掘
最大频繁项集
一种分布环境中最大频繁项目集挖掘算法
分布数据库
数据挖掘
最大频繁项目集
频繁模式树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布式全局频繁项目集的快速挖掘方法
来源期刊 西安交通大学学报 学科
关键词 数据挖掘 分布式数据库 全局频繁项目集 被约束子树
年,卷(期) 2006,(8) 所属期刊栏目 专题研究
研究方向 页码范围 923-927
页数 5页 分类号 TP311
字数 语种 中文
DOI 10.3321/j.issn:0253-987X.2006.08.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 覃征 西安交通大学计算机科学与技术系 158 2651 25.0 46.0
2 宋宝莉 西安交通大学计算机科学与技术系 6 70 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (48)
参考文献  (2)
节点文献
引证文献  (21)
同被引文献  (25)
二级引证文献  (88)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(3)
  • 引证文献(2)
  • 二级引证文献(1)
2008(9)
  • 引证文献(2)
  • 二级引证文献(7)
2009(17)
  • 引证文献(4)
  • 二级引证文献(13)
2010(13)
  • 引证文献(3)
  • 二级引证文献(10)
2011(11)
  • 引证文献(4)
  • 二级引证文献(7)
2012(7)
  • 引证文献(1)
  • 二级引证文献(6)
2013(8)
  • 引证文献(1)
  • 二级引证文献(7)
2014(7)
  • 引证文献(0)
  • 二级引证文献(7)
2015(7)
  • 引证文献(1)
  • 二级引证文献(6)
2016(8)
  • 引证文献(0)
  • 二级引证文献(8)
2017(6)
  • 引证文献(0)
  • 二级引证文献(6)
2018(9)
  • 引证文献(1)
  • 二级引证文献(8)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
数据挖掘
分布式数据库
全局频繁项目集
被约束子树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
论文1v1指导