Mark A. Hershkovitz and Detlef D.Leipe National Center for Biotechnology Information National Library of Medicine National Institutes of Health Bethesda,Maryland 系统发育学研究的是进化关系,系统发育分析就是要推断或者评估这些进化关系。通过系统发育分
网站地图本站论坛
高级搜索收藏本站
当前位置:试验方案>生物芯片>信息学> 正文
  • 系统发育分析

  • 点击:    作者:   来源: 日期:2007-07-04    本站论坛
Log�det尤其对位点之间的速率差异(见下文)敏感,因此,碱基频率的偏向可能只存在于那些承受变化的位点。

位点内速率差异模型

除了取代模型的多元化以外,一个序列中各个不同位点之间取代速率的差异也会对建立进化树的结果产生很深远的影响(Swofford et al., 1996a);关于位点之间的速率差异(或者叫做位点异质性),有一个最明显的例子,就是在一个编码序列中,三联体编码的位点差异:在三联体编码中,第三个编码位点比另外两个位点更加容易发生变化;正是出于这个原因,许多系统发育分析方法在分析编码序列时,都会把第三个编码位点排除在外;但是在某些情况下,速率差异模型会更加敏锐(比如,对应于蛋白质或者rRNA的保守序列)。

对位点差异的取代速率进行估值的方法有非参数化模型(W.M. Yang et al., 1996),不变式模型和gamma分布模型(Swofford et al., 1996a)。非参数化方法源于特异位点的相对速率的范畴;这个方法可以在MP建树方法中使用,只要根据相对的变异频率对特异位点进行简单加权就可以了,当然进行加权时需要有关于真实进化树的预备知识;这个方法同样也可以适用于ML建树方法,但是在计算上被认为是不切实际的(W.M. Yang et al., 1996)。不变式模型对一定比例的位点进行估值,这些位点并不能自由变化;剩余的位点假定为等概率变化。至于gamma模型方法,它假定一个给定的序列变化的概率是遵守gamma分布规律的,据此指定位点的取代概率;gamma分布的形状(有形状参数α描述)描述了一个序列中各个位点的取代频率的分布(Swofford et al., 1996a, p. 444, Figure 13; cf. Li, 1997, p. 76, Figure 3.10; 注意尺度差异)。在一个混合方法中,可以假定一部分位点是不变的,而剩余的位点则是按照gamma分布变化的。

实际上,gamma修正可以是连续的,离散的或者自离散的(W.M. Yang et al., 1996)。连续gamma的意思是各个位点沿一条连续的概率曲线变化;目前,这个方法在绝大多数情况下无法计算。离散gamma逼近方法指定各个位点的概率,使得这些(大量的)概率值逼近gamma曲线。自离散模型假定相邻的位点的变化速率是相关联的;许多组位点被分为许多类,其中每一类中的位点的变化速率可能被假定为常量或者异类值。

进化树建立程序使用各种各样的位点速率差异修正方法。对于核酸数据,PAUP 4.0在单独或者混合使用时间可逆的距离建树方法和最大似然建树方法时,既使用不变式gamma模型,也使用离散的gamma模型;在使用log�det距离建树方法时,使用不变式模型(见下)。对于核酸,氨基酸和编码子数据,PAML使用连续的,离散的和自离散的gamma

上一篇:多序列比对的实际应用   下一篇:利用蛋白质序列的预测方法

共45页: 上一页 [1] [2] [3] [4] [5] [6] [7] [8] 9 [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] 下一页

推荐文章
 
相关文章
推荐专题
 

↑返回顶部   打印本页   关闭窗口↓  
 本站申明 联系我们 网站地图
Copyright© 试验方案

Powered by DedeCms email:htmyth#yahoo.com.cn QQ:386836509

Optimized to 1024x768 to Firefox,Opera and MS-IE6