基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于R语言,将R程序包Rsubread、Rsamtools、refGenome和GenomicRanges整合为一个完整的流程,实现了基因表达芯片探针序列的自主注释.以应用范围最广的GPL570,GPL10558和曾使用的GPL21163芯片平台为测试数据进行重注释,并将GPL570的新注释与现存的注释做比较;对较新的长链非编码RNA表达芯片GPL16956进行自主注释,以测试流程的实用性.结果表明:GPL570的自主注释覆盖到了 89.58%的探针,GPL10558、GPL21163和GPL16956的自主注释分别覆盖到了 81.54%、84.68%和76.15%的探针.在GPL570新注释单独比对到的7 107个基因中,有411个编码蛋白的基因能够富集到GO条目,而另外两种注释未能比对到这些基因,证明了本流程的可靠性和先进性.因此,本流程实用、有效,为数据挖掘工作提供了新的有力工具.
推荐文章
基因表达谱芯片数据挖掘系统
数据挖掘
生物信息学
基因芯片
基因表达
分析模型
应用基因芯片技术筛选克山病差异表达基因
克山病
基因芯片
差异表达基因
外周血
基因表达谱芯片筛查子宫内膜癌相关基因的研究
寡核苷酸序列分析
子宫内膜肿瘤
基因表达谱
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于R语言的基因表达芯片注释流程
来源期刊 生物加工过程 学科
关键词 基因表达芯片(GEO) 数据挖掘 R语言
年,卷(期) 2021,(1) 所属期刊栏目 生物制造
研究方向 页码范围 17-22
页数 6页 分类号 Q786
字数 语种 中文
DOI 10.3969/j.issn.1672-3678.2021.01.003
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
基因表达芯片(GEO)
数据挖掘
R语言
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
生物加工过程
双月刊
1672-3678
32-1706/Q
大16开
南京市浦珠南路30号
2003
chi
出版文献量(篇)
1619
总下载数(次)
9
总被引数(次)
10170
论文1v1指导