基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的属性约简由于其时间复杂度和空间复杂度过高,几乎无法应用到大规模的数据集中.将随机抽样引入传统的模糊粗糙集中,使得属性约简的效率大幅度提升.首先,在统计下近似的基础上提出一种统计属性约简的定义.这里的约简不是原有意义上的约简,而是保持基于统计下近似定义的统计辨识度不变的属性子集.然后,采用抽样的方法计算统计辨识度的样本估计值,基于此估计值可以对统计属性重要性进行排序,从而可以设计一种快速的适用于大规模数据的序约简算法.由于随机抽样集以及统计近似概念的引入,该算法从时间和空间上均降低了约简的计算复杂度,同时又保持了数据集中信息含量几乎不变.最后,数值实验将基于随机抽样的序约简算法和两种传统的属性约简算法从以下3个方面进行了对比:计算属性约简时间消耗、计算属性约简空间消耗、约简效果.对比实验验证了基于随机抽样的序约简算法在时间与空间上的优势.
推荐文章
基于FCM的模糊粗糙属性约简
模糊聚类
模糊粗糙集
决策表
属性离散化
随机抽样在粗糙表面接触力学行为分析中的应用
接触
粗糙表面
轮廓曲线
正态分布
浅谈随机抽样学习的关键点
高中生
随机抽样
关键点
基于随机抽样和聚类特征的聚类算法
聚类
BIRCH算法
随机抽样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于随机抽样的模糊粗糙约简
来源期刊 软件学报 学科 工学
关键词 模糊粗糙集 随机抽样 属性约简 统计粗糙集
年,卷(期) 2017,(11) 所属期刊栏目 复杂环境下的机器学习研究专刊
研究方向 页码范围 2825-2835
页数 11页 分类号 TP311
字数 8581字 语种 中文
DOI 10.13328/j.cnki.jos.005337
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李雪峰 中国人民大学环境学院 13 29 4.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (1)
参考文献  (15)
节点文献
引证文献  (3)
同被引文献  (48)
二级引证文献  (3)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(4)
  • 参考文献(3)
  • 二级参考文献(1)
2006(4)
  • 参考文献(2)
  • 二级参考文献(2)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(4)
  • 引证文献(3)
  • 二级引证文献(1)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
模糊粗糙集
随机抽样
属性约简
统计粗糙集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导