基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Apriori算法是频繁项集挖掘的经典算法.针对Apriori算法的剪枝操作和多次扫描数据集的缺点,提出了基于散列的频繁项集分组(HFG)算法.证明了2-项集剪枝性质,采用散列技术存储频繁2-项集,将Apriori算法剪枝操作的时间复杂度从O(k×|Lk|)降低到0(1);定义了首项的子项集概念,将数据集划分为以Ii为首项的数据子集并采用分组索引表存储,在求以Ii为首项的频繁项集时,只扫描以Ii为首项的数据子集,减少了对数据集扫描的时间代价.实验结果表明,由于HFG算法的剪枝操作产生了累积效益,以及分组扫描排除了无效的项集和元组,使得HFG算法在时间性能方面与Apriori算法相比有较大提高.
推荐文章
基于索引数组的频繁项集挖掘算法
数据挖掘
关联规则
频繁项集
索引数组
基于格的快速频繁项集挖掘算法
数据挖掘
FP-树
频繁项集
基于项编码的分布式频繁项集挖掘算法
频繁项集挖掘
Apriori算法
大数据
分布式计算
基于WNegNodeset结构的加权频繁项集挖掘算法
加权频繁项集
加权支持度
位图加权树
按位运算符
差集策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于散列的频繁项集分组算法
来源期刊 计算机应用 学科 工学
关键词 频繁项集 2-项集剪枝 散列表 首项分组 索引表
年,卷(期) 2013,(11) 所属期刊栏目 数据库技术
研究方向 页码范围 3045-3048,3089
页数 5页 分类号 TP311
字数 4281字 语种 中文
DOI 10.11772/j.issn.1001-9081.2013.11.3045
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王红梅 吉林大学计算机科学与技术学院 38 175 7.0 11.0
3 胡明 长春工业大学计算机科学与工程学院 35 397 9.0 19.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (101)
参考文献  (5)
节点文献
引证文献  (7)
同被引文献  (3)
二级引证文献  (5)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
频繁项集
2-项集剪枝
散列表
首项分组
索引表
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导