基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对高维海量数据集离群点挖掘存在“维数灾难”的问题,提出了基于信息论的高维海量数据的离群点挖掘算法.该算法采用属性选择,去除冗余属性降维.利用信息熵作为离群点判断的度量标准,消除距离和密度量纲的弊端.在真实数据集上的实验结果表明,算法对高维海量数据离群点挖掘是有效可行的,其效率和精度得到了明显提高.
推荐文章
数据密集型计算环境下的离群点挖掘算法
离群点检测
网格
MapReduce
MR_DBScan
基于遗传模拟退火算法的高维离群点挖掘
数据挖掘
离群点
高维数据
遗传算法
模拟退火
离群点挖掘研究
离群点
数据挖掘
局部离群点
高维数据
数据流
离群数据挖掘综述
数据挖掘
离群检测
异常
高维离群
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于信息论的高维海量数据离群点挖掘
来源期刊 计算机科学 学科 工学
关键词 离群点挖掘 信息论 属性选择 互信息
年,卷(期) 2011,(7) 所属期刊栏目 数据库与数据挖掘
研究方向 页码范围 148-151,161
页数 分类号 TP311
字数 6605字 语种 中文
DOI 10.3969/j.issn.1002-137X.2011.07.033
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙志挥 东南大学计算机科学与工程系 148 3968 33.0 58.0
2 宋余庆 江苏大学计算机科学与通信工程学院 128 1213 20.0 29.0
3 倪巍伟 东南大学计算机科学与工程系 48 851 19.0 27.0
4 张净 东南大学计算机科学与工程系 7 139 6.0 7.0
8 晏燕华 江苏大学计算机科学与通信工程学院 4 51 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (50)
参考文献  (8)
节点文献
引证文献  (26)
同被引文献  (29)
二级引证文献  (70)
1948(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(4)
  • 引证文献(3)
  • 二级引证文献(1)
2013(6)
  • 引证文献(4)
  • 二级引证文献(2)
2014(13)
  • 引证文献(6)
  • 二级引证文献(7)
2015(11)
  • 引证文献(4)
  • 二级引证文献(7)
2016(12)
  • 引证文献(5)
  • 二级引证文献(7)
2017(15)
  • 引证文献(2)
  • 二级引证文献(13)
2018(17)
  • 引证文献(1)
  • 二级引证文献(16)
2019(16)
  • 引证文献(1)
  • 二级引证文献(15)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
离群点挖掘
信息论
属性选择
互信息
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导