基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高长非编码RNA(long non-coding RNA,lncRNA)预测的准确性,提出一种基于随机森林算法的lncRNA预测方法.在国际通用的基因注释和基因组序列训练数据集中,首先进行特征选取,然后采用随机森林算法对包含特征信息的数据集进行模型训练.选取的特征包含14种三聚核酸序列(ACG、CCG、CGA、CGC、CGG、CGT、CTA、GCG、GGG、GTA、TAA、TAC、TAG、TCG)的占比、终止密码子在3种阅读框中的数量标准差、GC含量、蛋白质编码能力、转录本长度、外显子个数、平均外显子长度和保守性分值.10折交叉验证结果表明,该预测方法在真阳性率、精确率、召回率、F值和AUC值等性能指标方面均优于其他算法.
推荐文章
长链非编码RNA NRON——一种新型的疾病调控因子
长链非编码RNA NRON
分子调控机制
疾病
长链非编码RNA与心力衰竭的关系
心力衰竭
长链非编码 RNA
一种基于随机森林的改进特征筛选算法
随机森林算法
特征筛选
肝癌预后预测
决策树
预测精度
特征集
长链非编码RNA在结直肠癌中的作用
结直肠癌
长链非编码RNA
肿瘤
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于随机森林的长非编码RNA预测方法
来源期刊 扬州大学学报(自然科学版) 学科 工学
关键词 长非编码RNA 随机森林 基因预测
年,卷(期) 2016,(4) 所属期刊栏目
研究方向 页码范围 50-53
页数 4页 分类号 TP391.4
字数 语种 中文
DOI 10.19411/j.1007-824x.2016.04.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡学龙 86 648 14.0 21.0
2 孙磊 25 139 8.0 11.0
3 许驰 4 7 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
长非编码RNA
随机森林
基因预测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
扬州大学学报(自然科学版)
季刊
1007-824X
32-1472/N
大16开
江苏省扬州市大学南路88号
28-48
1974
chi
出版文献量(篇)
1577
总下载数(次)
2
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导