基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于酵母二次迁移实验中表达谱相似的五类基因表达数据,研究了不同相似性度量准则、数据预处理方法及质心初始化方式对K-均值聚类效果的影响.结果表明:若对基因表达数据进行K-均值聚类分析,最好采用能反映数据结构特征的向量对质心进行初始化.若随机初始化质心,则采用取相对表达水平的预处理方式,以欧几里德距离(Euclidean distance)作为相似性测量准则,可以获得最佳的聚类结果;在欧氏距离准则下,标准化处理因可能破坏原始数据的幅度特征,而导致聚类结果变坏.若以Pearson相关系数为相似性准则则不同的数据预处理方式对结果无显著影响.
推荐文章
遗传K-均值初始化的t混合模型医学图像聚类
遗传算法
K-均值算法
参数初始化
t混合模型
聚类分析
基于划分的K-均值初始聚类中心优化算法
K-均值算法
中心点划分
聚类分析
基于PCA和K-均值聚类的有监督分裂层次聚类方法
数据挖掘
机器学习
有监督聚类
分裂层次聚类
基于图的K-均值聚类法中初始聚类中心选择
数据聚类
簇类
无向图
连通分支
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据预处理和初始化方法对K-均值聚类的影响
来源期刊 仪器仪表学报 学科 生物学
关键词 基因表达 聚类分析 K-均值聚类 数据预处理
年,卷(期) 2003,(z1) 所属期刊栏目 信息的检测与处理
研究方向 页码范围 189-192,209
页数 5页 分类号 Q-3
字数 3925字 语种 中文
DOI 10.3321/j.issn:0254-3087.2003.z1.062
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 万柏坤 天津大学精密仪器与光电子工程学院 122 1266 20.0 27.0
2 杨春梅 天津大学精密仪器与光电子工程学院 20 346 12.0 18.0
3 丁北生 天津大学精密仪器与光电子工程学院 9 104 5.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (11)
节点文献
引证文献  (11)
同被引文献  (16)
二级引证文献  (33)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(2)
  • 参考文献(2)
  • 二级参考文献(0)
1999(3)
  • 参考文献(3)
  • 二级参考文献(0)
2000(3)
  • 参考文献(3)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(6)
  • 引证文献(1)
  • 二级引证文献(5)
2015(5)
  • 引证文献(0)
  • 二级引证文献(5)
2016(8)
  • 引证文献(1)
  • 二级引证文献(7)
2017(9)
  • 引证文献(0)
  • 二级引证文献(9)
2018(5)
  • 引证文献(0)
  • 二级引证文献(5)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
基因表达
聚类分析
K-均值聚类
数据预处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
仪器仪表学报
月刊
0254-3087
11-2179/TH
大16开
北京市东城区北河沿大街79号
2-369
1980
chi
出版文献量(篇)
12507
总下载数(次)
27
总被引数(次)
146776
论文1v1指导