摘要:
目的:阐述广义复杂度定义和意义,比较四种脊椎动物DNA序列复杂性,检验我们提出的复杂度定义的正确性和合理性.方法:以不动点,周期2,不等概周期4,混沌和随机序列等简明序列为计算例,以"Bach/猴子击琴"历史著名质疑悬案问题为判据,检验广义复杂度定义的正确性.以人、公牛、老鼠和母鸡四种脊椎动为应用例,以重复性复杂度GCK(2)为主要测度指标,以有序化信息量I=log4-H1和剩余度R=1-H1/log4为参考指标,按定义公式计算GCR(2)、I和R值.结果:在简明计算例中,完全随机序列和完全规则序列的GCK(2)=0,GCC(2)=0,GCr(2)=0,说明完全规则不复杂,完全随机亦不复杂,这完全符合"Bach/猴子山琴"疑案问题的要求,检验了我们提出的广义复杂度定义的正确性.在四种脊椎动物DNA序列之间,GCR(2)、I和R值没有数量级差异,而在数量GCR(2)、I和R之间有数量级差异,即GCR(2)>>I(bit),GCR(2)>>R(%),而且人的GCR(2),I和R数值远远大于其它三种脊椎动物.结果表明,脊椎动物进化基本上在同一水平上,但人的DNA序列的复杂性、有序化信息量和后备存储剩余度均高于其它脊椎动物.脊椎动物DNA序列的进化有个共同特点:在进化熵减过程中,重点不是放在碱基组成的有序化(I)上,而是放在碱基关联的复杂化GCR(2)上.所有这些结论均符合生物信息学生物分子进化规律,说明我们提出的广义复杂度定义是合理的.