基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
发现新的癌基因是癌症研究的主要目标之一.生物信息学方法可以帮助加快癌基因的发现,理解癌症发生机制和挖掘药物靶标.通过整合网络属性、序列特征和功能注释信息,建立了一个能用于潜在癌基因预测的分类器.通过检测发现,在癌基因与非癌基因之间有55个特征显示了显著的差异.14个癌症相关的特征被用于训练分类器.在分类器中,探索使用4种机器学习方法,即logistic回归、支持向量机、贝叶斯网络和决策树,来区分癌基因与非癌基因.通过5倍交叉验证评估不同模型的有效性,发现这4种方法对应的ROC曲线下面积分别为0.834,0.740,0.800和0.782.最后,将基于多种生物学特征的logistic回归分类器应用于Entrez数据库中的基因,发现了1976个潜在的癌基因.本研究发现,整合的预测方法优于基于单一证据的预测模型,而网络特征和功能注释信息相比序列特征具有更强的预测能力.
推荐文章
人3p24-p25 478 kb完全基因组序列的注释
人类基因组计划
基因组注释
神经网络在基因序列预测中的应用研究
神经网络
基因工程
内含子
外显子
基于混沌时间序列和神经网络的网络流量预测方法
时间序列
相空间重构
神经网络
网络流量预测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 整合网络属性、序列特征和功能注释预测潜在的癌基因
来源期刊 中国科学(生命科学) 学科
关键词 癌基因 Logistic回归 网络特征 序列特征 功能注释
年,卷(期) 2013,(7) 所属期刊栏目 论文
研究方向 页码范围 589-595
页数 7页 分类号
字数 语种 中文
DOI 10.1007/s11427-013-4500-6
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谢红卫 51 353 11.0 16.0
2 刘伟 46 295 9.0 15.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (20)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1982(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(3)
  • 参考文献(3)
  • 二级参考文献(0)
2006(3)
  • 参考文献(3)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
癌基因
Logistic回归
网络特征
序列特征
功能注释
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科学(生命科学)
月刊
1674-7232
11-5840/Q
北京东黄城根北街16号
chi
出版文献量(篇)
2757
总下载数(次)
7
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导