基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
发现数据流中的频繁项是数据流挖掘中最基本的问题之一.数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用.针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法.算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘.通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε.分析和实验表明算法有较好的性能.
推荐文章
面向数据流的频繁模式挖掘研究
数据流
数据挖掘
数据流挖掘
频繁模式
分布式数据流中挖掘频繁项算法的研究
分布式数据流
频繁项
多线程并发技术
基于DSFCI-tree的分布式数据流频繁闭合模式挖掘
数据挖掘
分布式数据流
关联规则
频繁闭合项集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 挖掘数据流中的频繁模式
来源期刊 计算机研究与发展 学科 工学
关键词 数据流 频繁模式 FP-DS算法 流数据挖掘
年,卷(期) 2005,(12) 所属期刊栏目 数据挖掘
研究方向 页码范围 2192-2198
页数 7页 分类号 TP311
字数 6003字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 董逸生 东南大学计算机科学与技术系 118 3003 29.0 49.0
2 徐宏炳 东南大学计算机科学与技术系 53 1077 20.0 32.0
3 王永利 东南大学计算机科学与技术系 24 516 12.0 22.0
4 刘学军 东南大学计算机科学与技术系 59 564 12.0 21.0
8 钱江波 东南大学计算机科学与技术系 20 584 14.0 20.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (108)
同被引文献  (25)
二级引证文献  (123)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(3)
  • 引证文献(3)
  • 二级引证文献(0)
2007(9)
  • 引证文献(8)
  • 二级引证文献(1)
2008(17)
  • 引证文献(15)
  • 二级引证文献(2)
2009(33)
  • 引证文献(18)
  • 二级引证文献(15)
2010(33)
  • 引证文献(17)
  • 二级引证文献(16)
2011(20)
  • 引证文献(11)
  • 二级引证文献(9)
2012(29)
  • 引证文献(11)
  • 二级引证文献(18)
2013(19)
  • 引证文献(8)
  • 二级引证文献(11)
2014(12)
  • 引证文献(4)
  • 二级引证文献(8)
2015(4)
  • 引证文献(1)
  • 二级引证文献(3)
2016(12)
  • 引证文献(2)
  • 二级引证文献(10)
2017(13)
  • 引证文献(3)
  • 二级引证文献(10)
2018(15)
  • 引证文献(6)
  • 二级引证文献(9)
2019(10)
  • 引证文献(1)
  • 二级引证文献(9)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
数据流
频繁模式
FP-DS算法
流数据挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导