基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基因表达数据具有高维小样本特点,包含了大量与疾病无关的基因,对该类数据进行分析的首要步骤是特征选择.常见的特征选择方法需要有类标的数据,但样本类标获取往往比较困难.针对基因表达数据的特征选择问题,提出基于谱聚类的无监督特征选择思想FSSC(feature selection by spectral clustering).FSSC对所有特征进行谱聚类,将相似性较高的特征聚成一类,定义特征的区分度与特征独立性,以二者之积度量特征重要性,从各特征簇选取代表性特征,构造特征子集.根据使用的不同谱聚类算法,得到FSSC-SD(FSSC based on standard deviation)、FSSC-MD(FSSC based on mean distance)和FSSC-ST(FSSC based on self-tuning)这3种无监督特征选择算法以SVMs(support vector machines)和KNN(K-nearest neighbours)为分类器,在10个基因表达数据集上进行实验测试.结果表明,FSSC-SD、FSSC-MD和FSSC-ST算法均能选择到具有强分类能力的特征子集.
推荐文章
无监督环境下基于聚类集成的特征选择
特征聚类
无监督学习
集成聚类
基于K-均值聚类的无监督的特征选择方法
特征选择
相关性分析
无监督学习
聚类
基于最优投影的半监督谱聚类算法
半监督
最优投影
簇类
Nystr(o)m抽样
谱聚类
基于词条属性聚类的文本特征选择算法
文本特征选择
词条属性
词位置
词间关联性
关联规则算法
K-均值算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于谱聚类的无监督特征选择算法
来源期刊 软件学报 学科 工学
关键词 谱聚类 无监督特征选择 特征独立性 特征区分度 特征重要度
年,卷(期) 2020,(4) 所属期刊栏目 非经典条件下的机器学习方法专题
研究方向 页码范围 1009-1024
页数 16页 分类号 TP181
字数 9942字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谢娟英 陕西师范大学计算机科学学院 46 873 15.0 28.0
2 王明钊 陕西师范大学生命科学学院 5 35 4.0 5.0
3 丁丽娟 陕西师范大学计算机科学学院 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (163)
共引文献  (231)
参考文献  (24)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1906(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(7)
  • 参考文献(3)
  • 二级参考文献(4)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(7)
  • 参考文献(0)
  • 二级参考文献(7)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(8)
  • 参考文献(1)
  • 二级参考文献(7)
2002(16)
  • 参考文献(0)
  • 二级参考文献(16)
2003(12)
  • 参考文献(1)
  • 二级参考文献(11)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(11)
  • 参考文献(3)
  • 二级参考文献(8)
2006(8)
  • 参考文献(1)
  • 二级参考文献(7)
2007(8)
  • 参考文献(2)
  • 二级参考文献(6)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(9)
  • 参考文献(1)
  • 二级参考文献(8)
2013(8)
  • 参考文献(0)
  • 二级参考文献(8)
2014(10)
  • 参考文献(0)
  • 二级参考文献(10)
2015(11)
  • 参考文献(2)
  • 二级参考文献(9)
2016(10)
  • 参考文献(2)
  • 二级参考文献(8)
2017(11)
  • 参考文献(4)
  • 二级参考文献(7)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
谱聚类
无监督特征选择
特征独立性
特征区分度
特征重要度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导