基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
论文主要利用计算语言学中使用的统计学方法定量分析生物物种的亲缘关系.以包含生物体遗传信息的核酸序列为研究对象,采用计算语言学的思想和方法,将每一个生物体的核酸序列看作一篇很长的自然语言文本,抽取核酸序列的双核苷酸频率分布特征向量,用以表征其数字特征.而后采用Pearson Correlation Coefficient(Pearson相关系数)定量分析其亲缘关系的远近程度.将119个细菌的全基因组核酸序列进行两两比对,对所得的7 021个r值进行分析,得出的结论是:亲缘关系越相近的物种,其Pearson相关系数越大.取定0.985作为"属"的分界阈值时,得到召回率为75.824%,准确率为73.404%.论文对定量分析生物学核酸序列的相似性和对生物亲缘关系远近的建模有重要的实际意义.
推荐文章
相关系数MA(q)序列分析方法
时间序列 MA(q)序列 相关系数MA(q)序列 非平稳随机过程 极大似然估计
相关系数平稳过程方法
随机过程
平稳过程
相关系数平稳过程
正态过程
极大似然估计
相关系数平稳序列自适应算法
相关系数平稳序列
自适应算法
实时处理
信号分析
滤波
预测
相关系数平稳序列数据融合方法
相关系数平稳序列
数据融合
滤波
多传感器
信号处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用Pearson相关系数定量分析生物亲缘关系
来源期刊 计算机工程与应用 学科 工学
关键词 Pearson相关系数 核酸序列 自然语言文本
年,卷(期) 2005,(33) 所属期刊栏目 学术探讨
研究方向 页码范围 79-82,99
页数 5页 分类号 TP391
字数 4906字 语种 中文
DOI 10.3321/j.issn:1002-8331.2005.33.026
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张宇镭 上海交通大学生命科学与技术学院 4 138 2.0 4.0
2 党琰 上海交通大学计算机科学与工程系 3 137 2.0 3.0
3 贺平安 复旦大学理论生命科学研究中心 1 134 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (134)
同被引文献  (298)
二级引证文献  (238)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(7)
  • 引证文献(7)
  • 二级引证文献(0)
2012(5)
  • 引证文献(4)
  • 二级引证文献(1)
2013(4)
  • 引证文献(4)
  • 二级引证文献(0)
2014(19)
  • 引证文献(15)
  • 二级引证文献(4)
2015(27)
  • 引证文献(12)
  • 二级引证文献(15)
2016(31)
  • 引证文献(12)
  • 二级引证文献(19)
2017(66)
  • 引证文献(21)
  • 二级引证文献(45)
2018(74)
  • 引证文献(25)
  • 二级引证文献(49)
2019(92)
  • 引证文献(16)
  • 二级引证文献(76)
2020(38)
  • 引证文献(9)
  • 二级引证文献(29)
研究主题发展历程
节点文献
Pearson相关系数
核酸序列
自然语言文本
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导