[ paup> lse rma=pre sha=pre pi=pre ]),将会激活参数的估值。于是这些数值将会为ML建树搜索服务。同样地,这些数值可以插入到相似的距离方法的参数设置中,为距离方法建树搜索服务。
图9.8
星型分解图。本图显示了诸如相邻连接方法之类的建树算法的工作方式。最相近的两个终端被连接起来,并在它们和剩余的终端之间插入一个树枝。然后,这个新的树枝得到修整,使得这个树枝的数值是两个原始值的平均数,并产生一个只包含n-1个终端的星型图。这个过程将反复进行,直到最后只剩下一个终端为止。
图9.9
测试数据中的系统发育信号的偏差实验:一个PAUP输出(命令行在括弧内用粗体字体显示)。这个程序的命令行版本需要在命令行中输入命令,但是同样的命令还可以通过菜单界面给出。这个实验使用的样本同图9.7中的一样,都是18S rDNA数据集,并且假定优化标准是MP标准。对MP而言不提供信息的特征符已经被删除,因为如果数据中这些特征符的比例较高的话,将会对结果产生误导。所有的进化树分值的全部输出会非常冗长;因此这个实验命令提供了一个选项,可以输出一个包含20个分类的柱状图(20是默认值)。默认的复制数目是1000,在这里已经大大增加了。对33个分类群所作的g1统计非常重要:其数值比拥有25个分类群和500个特征符(Hillis and Huelsenbeck, 1992)的系统临界值(-0.09; p=0.01)还要小很多(负数);对于拥有更多的分类群和特征符的系统,还没有给出临界值,但是可想而知,这些值必将更加小(负数)。这个MP进化树的分值是2315分(比较图9.7),比起500个随机进化树中的任何一个都要小得多。接下来会进行第二次实验,但是将从18S数据集中删除被子植物的数据。分类群可以根据名字或者编号被临时删除,而被子植物恰好是数据文件中的前10个分类群。在这种情况下,g统计要比拥有500个特征符和10个分类群的系统的临界值(-0.16; p=0.5)大得多(正数),显示出18S序列没有系统发育信号来解决这些样本的关系。用这些18S数据以及10个被子植物得到的MP
上一篇:多序列比对的实际应用 下一篇:利用蛋白质序列的预测方法
共45页: 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] 41 [42] [43] [44] [45] 下一页