基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于不确定数据的向下封闭属性,挖掘全部频繁项集的方法会得到一个指数级的结果.为获得一个较小的合适的结果集,研究了在不确定数据上挖掘频繁闭项集,并提出了一种新的频繁闭项集挖掘算法——NA-PFCIM.该算法将项集挖掘过程看作一个概率分布函数,考虑到基于正态分布模型的方法提取的频繁项集精确度较高,而且支持大型数据库,采用了正态分布模型提取频繁项集.同时,为了减少搜索空间以及避免冗余计算,利用基于深度优先搜索的策略来获得所有的概率频繁闭项集.该算法还设计了两个剪枝策略:超集修剪和子集修剪.最后,在常用的数据集(T10I4D100K、Accidents、Mushroom、Chess)上,将提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法进行比较.实验结果表明,NA-PFCIM算法能够减少所要扩展的项集,同时减少项集频繁概率的计算,其性能优于对比算法.
推荐文章
基于差分隐私的不确定数据频繁项集挖掘算法
差分隐私
不确定数据的频繁项集
截断期望支持度
基于约束的不确定数据频繁项集挖掘算法研究
频繁项
不确定数据
项目约束
反单调约束
概念格
一种有效的不确定数据概率频繁项集挖掘算法
不确定数据
可能世界
期望支持度
概率频繁项集
基于不确定数据的可能频繁闭序列模式挖掘
不确定数据
可能频繁闭序列模式
概率频繁
不确定数据挖掘
闭序列模式
序列模式增长
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不确定数据频繁闭项集挖掘算法
来源期刊 计算机应用 学科 工学
关键词 不确定数据 频繁项集 频繁闭项集 剪枝策略 正态分布
年,卷(期) 2015,(10) 所属期刊栏目 人工智能
研究方向 页码范围 2911-2914
页数 4页 分类号 TP311.138
字数 4333字 语种 中文
DOI 10.11772/j.issn.1001-9081.2015.10.2911
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵鹏 安徽大学计算机科学与技术学院 61 683 15.0 24.0
2 刘慧婷 安徽大学计算机科学与技术学院 64 1093 15.0 31.0
3 姚晟 安徽大学计算机科学与技术学院 26 191 10.0 13.0
4 沈盛霞 安徽大学计算机科学与技术学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (10)
参考文献  (5)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
不确定数据
频繁项集
频繁闭项集
剪枝策略
正态分布
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导