outfile”(也可以是“treefile”)的文件中去。如果另外一个程序还要读取这个输出文件,就必须将“outfile”文件改名(改为“infile”)。图9.10给出了建立一个自引导的相邻连接的进化树的步骤的几个要点。接下来的部分我们将讨论一些用PHYLIP程序推导进化树的细节问题。
分析蛋白质数据的程序
PROTDIST程序计算蛋白质序列比对的距离矩阵。这个程序允许使用者从三个氨基酸取代的进化模型中选择其中之一。最简单的也是最快的(也是最不理想的)模型假定每一个氨基酸编程其它19中氨基酸的机会都是均等的。第二种是类别模型,在这个模型中,氨基酸分布在不同的分组中,按照转换的不同类别(转化成本组的氨基酸或者其它分组的氨基酸)进行评估。推荐使用第三种(默认的)方法,这个方法使用一张通过观察氨基酸转换得到的经验表,即DayHoff PAM 001方阵(DayHoff, 1979)。在PHYLIP文档中和最新出版物(Felsenstein, 1996)中可以找到详细资料。
PROTPARS程序计算蛋白质序列的似然值。这个方法使用的进化模型同PROTDIST程序中使用的进化模型不同,前者在评估观察到的氨基酸序列的转化的可能性时,考虑到潜在的核苷酸序列的转换。特别地,它作出如下(富有生物学意义的)假定:同义转化 [比方说:GCA (alanine)à GCC (alanine)] 比非同义转化的发生频率要高。这样,举个例子来说,如果两个氨基酸之间的转化需要在潜在的核苷酸水平上进行三次非同义转换,那么这个转换的可能行比起那些在潜在的核苷酸水平上只要进行两次非同义转换和一次同义转换的氨基酸转化的可能性要小。PROTPARS不提供氨基酸转化的经验值选项(象PAM方阵那样的)。
分析核酸数据的程序
DANDIST计算核苷酸序列的距离矩阵,然后运行NEIGHBOR或者PHYLIP软件包中的其它距离矩阵程序计算输出结果,产生进化树。DANDIST允许用户从三种核苷酸取代模型中选择其中之一。比较老的(1969)Jukes and Cantor模型同PROTDIST程序中的简单模型很相似,前者假定所有的核苷酸取代频率都一相等。比较近的(1980)Kimura双�参数模型与之也很相似,但是它允许用户把颠换的权重设置得比转换的权重要高。PHYLIP也包含DNAML,这是一个针对核苷酸数据的最大似然程序。因为这个程序执行起来相当慢,所以下面将描述一个推荐使用的程序��
上一篇:多序列比对的实际应用 下一篇:利用蛋白质序列的预测方法
共45页: 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] 23 [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] 下一页