基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基因组组装是宏基因组分析的主要挑战之一。通常假设所有测序序列均来源于同一个基因组,微生物中非常活跃的可移动元件给这个前提假设提出了重大质疑。文章将该质疑抽象为可移动元件与宿主染色体之间的二分类问题,准确的二分类性能将进一步促进宏基因组学方面的研究。基于宏基因组测序数据的数值化特征,详细考察特征选择算法 ReliefF、卡方检验和 Fisher判别t检验,并结合分类模型逻辑回归、极限学习机、支持向量机和随机森林,验证最优可移动元件检测模型的性能。实验结果表明,ReliefF特征选择算法和随机森林分类算法的融合模型,使用100个特征即可正确分类95%以上的宏基因组测序数据,优于使用全部的690个特征。
推荐文章
宏基因组技术在耐药细菌研究中的应用
宏基因组技术
耐药细菌
非培养微生物
抗耐药菌抗菌药物
宏基因组技术在开发未培养环境微生物基因资源中的应用
宏基因组
未培养微生物
核酸提取
宏基因组文库构建
宏基因组文库筛选
温泉土壤宏基因组文库构建及普鲁兰酶筛选
普鲁兰酶
宏基因组
16S rRNA
DNA文库
温泉土壤
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 宏基因组中可移动序列的精确检测问题研究
来源期刊 集成技术 学科 工学
关键词 基因分类 数据挖掘 特征选择 基因组条形码
年,卷(期) 2016,(2) 所属期刊栏目
研究方向 页码范围 85-96
页数 12页 分类号 TG156
字数 7519字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭超 中国科学院深圳先进技术研究院 17 31 2.0 5.0
5 葛瑞泉 中国科学院深圳先进技术研究院 2 1 1.0 1.0
9 王普 中国科学院深圳先进技术研究院 2 1 1.0 1.0
13 周丰丰 中国科学院深圳先进技术研究院 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (118)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(3)
  • 参考文献(3)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(5)
  • 参考文献(2)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(2)
  • 二级参考文献(2)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(9)
  • 参考文献(2)
  • 二级参考文献(7)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
基因分类
数据挖掘
特征选择
基因组条形码
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
集成技术
双月刊
2095-3135
44-1691/T
大16开
深圳市南山区西丽深圳大学城学苑大道1068号
2012
chi
出版文献量(篇)
677
总下载数(次)
2
总被引数(次)
1808
论文1v1指导