基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
非频繁项集是未被标准化的频繁项集产生算法(如APRIORI以及FP-Growth算法)提取的所有项集.在数据集上挖掘有意义的非频繁项集是数据挖掘的重要工作之一.目前,基于传统数据集的非频繁项集挖掘研究主要集中在负相关、负模式以及间接关联等方面,且主要是对整个数据集上的性质进行分析,而没有对数据集的切片进行分析.该文提出了一种新的模式,试图找到符合如下条件的特定子群,其描述的数据集切片上存在某些特殊项集,这些项集在整个数据集上并非频繁项集,但是在该数据集切片上却是频繁项集.根据用户要求自动找出这些异常子群以及其对应项集的算法在数据分析中有着十分重要的意义.该文提出的解决方案由两部分组成:候选产生阶段以及查询交互阶段.前者是一个脱机处理的过程,而后者则是在线实时反馈的过程.在候选产生阶段,该文提出了一种基于多维数据集高效产生频繁项集以及显著予群并有效建立索引的算法.根据索引,在查询交互阶段,该文提出的算法框架可以快速准确地返回给定查询对应的异常子群以及对应项集.基于多个真实数据集的实验表明,该文提出的方案可以根据用户要求实时返回有意义的异常子群以及对应项集.此外,该文提出的算法在多维数据集上的挖掘效率比UTMTU算法提升了数倍.
推荐文章
入侵检测不平衡样本子群发现数据简化策略
子群发现
不平衡数据集
数据简化
实例选择
特征选择
入侵检测不平衡样本子群发现数据简化策略
子群发现
不平衡数据集
数据简化
实例选择
特征选择
用SQL Server 2000 Analysis Service设计与创建多维数据集
分析服务
维度
多维数据集
聚合体
基于粒矩阵的动态大数据多维关联性分析技术
动态大数据
多维关联性
粒矩阵
PSO算法
大数据粒化
数据处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多维数据集的异常子群发现技术
来源期刊 计算机学报 学科 工学
关键词 频繁项集挖掘 子群发现 多维数据集 数据挖掘 异常检测
年,卷(期) 2019,(8) 所属期刊栏目 大数据
研究方向 页码范围 1671-1685
页数 15页 分类号 TP391
字数 13972字 语种 中文
DOI 10.11897/SP.J.1016.2019.01671
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 寿黎但 浙江大学计算机辅助设计与图形学国家重点实验室 16 34 4.0 5.0
2 陈刚 6 3 1.0 1.0
3 陈珂 3 3 1.0 1.0
4 张静恬 浙江大学计算机科学与技术学院 1 2 1.0 1.0
5 伍赛 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (53)
共引文献  (9)
参考文献  (12)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(10)
  • 参考文献(1)
  • 二级参考文献(9)
2013(9)
  • 参考文献(0)
  • 二级参考文献(9)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(6)
  • 参考文献(5)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
频繁项集挖掘
子群发现
多维数据集
数据挖掘
异常检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
浙江省自然科学基金
英文译名:
官方网址:http://www.zjnsf.net/
项目类型:一般项目
学科类型:
论文1v1指导