基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 非编码RNA-蛋白质的相互作用(noncoding RNA?protein interactions,ncRPI)具有重要的生物学意义,目前预测其相互作用已成为当下研究非编码RNA(noncoding RNA,ncRNA)和蛋白质功能的重要途径之一.方法 本研究基于ncRNA和蛋白质的序列信息提取特征,运用卷积自编码器预处理原始数据,训练三个机器学习模型:LightGBM(LBM)、随机森林(random forest,RF)和极端梯度增强算法(extreme gradient boosting,XGB),预测ncRNA与蛋白质的相互作用.结果 在RPI369和RPI488两个数据集做5倍交叉验证,LBM、RF与XGB三个模型在两个数据集均达到较高的预测准确率,在RPI369数据集三个模型的预测准确率分别为0.757(LBM)、0.791(RF)、0.791(XGB),在RPI488数据集三个模型的预测准确率分别为0.918(LBM)、0.908(RF)、0.918(XGB);三个模型在RPI1807、RPI2241、RPI13254大数据集也取得较高的AUC(area under curve)值,在RPI1807三个模型的AUC值均为0.99,在RPI2241三个模型最低AUC值为0.87,在RPI13254三个模型最低AUC值为0.81,都表现出较好的预测准确性.结论 机器学习方法能够预测ncRNA与蛋白质是否存在相互作用.
推荐文章
RNA结合蛋白与RNA-蛋白质相互作用的研究进展
RNA结合蛋白
RNA-蛋白质
相互作用
蛋白质组学
蛋白质相互作用预测的核最近邻算法
生物信息学
蛋白质相互作用
核最近邻算法
分类
基于结构域理化性质的蛋白质相互作用方向预测
蛋白质
相互作用
结构域
理化特性
支持向量机
方向预测
基于蛋白质相互作用网络预测癌症致病基因
疾病基因
癌症
蛋白质相互关系
预测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于机器学习方法的非编码RNA-蛋白质相互作用的预测
来源期刊 北京生物医学工程 学科 医学
关键词 非编码RNA-蛋白质相互作用 LightGBM 随机森林 极端梯度增强算法 卷积自编码器
年,卷(期) 2019,(4) 所属期刊栏目 论著
研究方向 页码范围 353-359
页数 7页 分类号 R318.01|Q51
字数 4708字 语种 中文
DOI 10.3969/j.issn.1002-3208.2019.04.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谭建军 北京工业大学生命科学与生物工程学院 26 42 4.0 5.0
2 程淑萍 北京工业大学生命科学与生物工程学院 1 1 1.0 1.0
3 门婧睿 北京工业大学生命科学与生物工程学院 3 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (14)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(4)
  • 参考文献(4)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
非编码RNA-蛋白质相互作用
LightGBM
随机森林
极端梯度增强算法
卷积自编码器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京生物医学工程
双月刊
1002-3208
11-2261/R
16开
北京安定门外安贞医院
1981
chi
出版文献量(篇)
2829
总下载数(次)
13
总被引数(次)
15960
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导