基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择。算法首先采用Pearson相关系数和Wilcoxon秩和检验计算各基因与类标的相关性,根据统计相关性原则选取与类标相关性较大的若干基因构成预选择基因子集;然后,采用K-means算法将预选择基因子集中高度相关的基因聚集到同一类簇,训练 SVM 分类模型,计算每一个基因的权重,从每一类簇选择一个权重最大或者采用轮盘赌思想从每一类簇选择一个得票数最多的基因作为本类簇的代表基因,各类簇的代表基因构成有效区分基因子集。将该算法与采用随机策略选择各类簇代表基因的随机基因选择算法 Random, Guyon的经典基因选择算法SVM-RFE、采用顺序前向搜索策略的基因选择算法SVM-SFS进行实验比较,几个经典基因数据集上的200次重复实验的平均实验结果表明:所提出的混合基因选择算法能够选择到区分性能非常好的基因子集,建立在该区分基因子集上的分类器具有非常好的分类性能。
推荐文章
基于改进磷虾群算法的K-means算法
磷虾群算法
聚类算法
精英引领
最佳聚类数
动态分群
基于Spark的并行K-means算法研究
Spark
K-means
PSO
迭代计算
K-means聚类算法初始中心选择研究
K-means聚类算法
K个聚类中心
密度参数
K-means算法改进
基于变异的k-means聚类算法
聚类
mk-means算法
变异
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于统计相关性与K-means的区分基因子集选择算法
来源期刊 软件学报 学科 工学
关键词 区分基因子集选择 Pearson 相关系数 Wilcoxon 秩和检验 K-means 聚类 统计相关性 Filter 算法 Wrapper算法
年,卷(期) 2014,(9) 所属期刊栏目 大数据分析专刊
研究方向 页码范围 2050-2075
页数 26页 分类号 TP181
字数 19643字 语种 中文
DOI 10.13328/j.cnki.jos.004644
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谢娟英 陕西师范大学计算机科学学院 46 873 15.0 28.0
2 高红超 陕西师范大学计算机科学学院 2 99 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (89)
参考文献  (18)
节点文献
引证文献  (77)
同被引文献  (203)
二级引证文献  (165)
1963(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(1)
  • 参考文献(1)
  • 二级参考文献(0)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(4)
  • 参考文献(2)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(7)
  • 参考文献(0)
  • 二级参考文献(7)
2002(8)
  • 参考文献(1)
  • 二级参考文献(7)
2003(5)
  • 参考文献(2)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(3)
  • 二级参考文献(1)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(8)
  • 引证文献(8)
  • 二级引证文献(0)
2016(21)
  • 引证文献(19)
  • 二级引证文献(2)
2017(39)
  • 引证文献(19)
  • 二级引证文献(20)
2018(73)
  • 引证文献(22)
  • 二级引证文献(51)
2019(61)
  • 引证文献(6)
  • 二级引证文献(55)
2020(40)
  • 引证文献(3)
  • 二级引证文献(37)
研究主题发展历程
节点文献
区分基因子集选择
Pearson 相关系数
Wilcoxon 秩和检验
K-means 聚类
统计相关性
Filter 算法
Wrapper算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导