基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
挖掘频繁项集是数据挖掘中最基本的问题之一,而大型数据库庞大的数据使得传统的频繁模式挖掘算法难以适用。针对大型数据库的特点,在分析FP-growth算法的基础上,提出一种基于等价类的大型数据库频繁模式挖掘算法EFP-growth(Equivalent Classes Frequent Patterns-Growth)算法。EFP-growth算法利用项集等价类将关联规则挖掘的项集分成互不相交的子空间的性质,将一个大型数据库分解成多个投影数据库,依次在每一个投影数据库上进行约束频繁项集挖掘。算法尤其适合支持度较小时的大型数据库的挖掘。分析和实验表明EFP-growth算法在挖掘大型数据库时时间和空间的性能上均优于FP-growth算法。而且,随着数据库规模的增大,EFP-growth算法具有更明显的优势。
推荐文章
基于格的快速频繁项集挖掘算法
数据挖掘
FP-树
频繁项集
基于模糊等价类的频繁项集精简表示方法
数据挖掘
模糊等价类
类闭合集
频繁项集
精简表示
关联规则
基于索引数组的频繁项集挖掘算法
数据挖掘
关联规则
频繁项集
索引数组
频繁项集快速挖掘及更新算法
数据挖掘
频繁项集
关联规则
项集矩阵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于等价类的大型数据库频繁项集挖掘算法
来源期刊 新型工业化 学科
关键词 电路与系统 数据挖掘 FP-树 频繁模式 等价类
年,卷(期) 2011,(4) 所属期刊栏目 设计与研究
研究方向 页码范围 35-44
页数 10页 分类号
字数 6202字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 毛建旭 湖南大学电气与信息工程学院 46 665 15.0 24.0
2 刘彩苹 湖南大学信息科学与工程学院 13 111 6.0 10.0
3 毛建频 2 19 1.0 2.0
4 姚晓玲 湖南大学电气与信息工程学院 1 18 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (64)
参考文献  (2)
节点文献
引证文献  (18)
同被引文献  (154)
二级引证文献  (164)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(8)
  • 引证文献(7)
  • 二级引证文献(1)
2015(19)
  • 引证文献(6)
  • 二级引证文献(13)
2016(29)
  • 引证文献(2)
  • 二级引证文献(27)
2017(42)
  • 引证文献(3)
  • 二级引证文献(39)
2018(48)
  • 引证文献(0)
  • 二级引证文献(48)
2019(24)
  • 引证文献(0)
  • 二级引证文献(24)
2020(12)
  • 引证文献(0)
  • 二级引证文献(12)
研究主题发展历程
节点文献
电路与系统
数据挖掘
FP-树
频繁模式
等价类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
新型工业化
月刊
2095-6649
11-5947/TB
16开
北京石景山区鲁谷路35号1106室
2011
chi
出版文献量(篇)
2442
总下载数(次)
8
总被引数(次)
5690
论文1v1指导