70%,那么所得到的系统发育进化树能够反映真实的系统发生史的可能性要大于95%(Hillis and Bull, 1993)。同理,如果条件不是很合适,那么如果自引导数值大于50%,则精确性的评估就会过高(Hillis and Bull, 1993)。在某些条件下,如果自引导数值较高,可能会使系统发生史看起来很好,从而得出错误的结论。
实际的考虑
如果样本较小,这个技术是不会被用到的。如果一个特定的分组不太可信的话,那么就可以使用自引导方法进行评估,以确认将这个分组并入一个大的单源分组中是否可信(Sanderson, 1989)。也可以在实验中使用自引导方法,这个实验的具体做法是:每次删除一个内部树枝,然后根据剩余的内部树枝重新计算进化树,这样做的目的是为了收集分歧顺序信息,而这些信息在整个数据集中都是很不明确的(见实例:Leipe et al., 1994)。
对折方法
对折方法同自引导方法相似,都是要重新进行取样。但是,与自引导方法中产生“可以替换”的新的数据集不同的是,对折方法在对原始数据集重新取样时,是从每一个复制中除去一个和多个比对位点;结果是每一个对折的复制品都比原始数据集要小,而且不会包含重复的数据位点。虽然绝大多数论文都假定通过不同的技术方法评估所得到的可变性都应该很相似(Swofford and Olsen, 1990; Swofford et al., 1996a),实际上对折方法的使用频率远低于自引导方法。尽管如此,对折方法仍然有一定的市场,象PAUP和PHYLIP这样的程序里都包含有这个选项。
带参数的自引导方法
带参数的自引导方法同不带参数的自引导方法不同,前者使用了模拟的但是仍然真实的复制品,而不是虚假的复制品。在进行系统发育的序列分析中,与原始数据集大小相同的复制数据集是通过一个特殊的序列进化模型得到的,数据集还包括根据这个模型得到的最佳进化树拓扑结构(Huelsenbeck et al., 1996a),然后就可以使用感兴趣的方法对每一个数据集进行分析。对实验进化树的树枝是否支持的判定方法同无参数的自引导方法大体相同。
作为一种还没有被其它方法(诸如进化树中所显示的分类群中的任何分组的单个谱系)(Huelsenbeck et al., 1996a, 1996b)检验过的测试假定,带参数的自引导方法还不能算是无参数的自引导方法之外的一种选择。在每一个复制品的分析中,“真实的”进化树(假定能够产生模拟数据的进化树)的分值可能会比每一个复制品的最好的进化树的分值都要大(或者小)。分值差异图则显示了样本偏差的一个真实的正规分布。任何期望的可选的进化树拓扑的分值差异的重要价值可以由这个正规图来决定。带参数的自引导方法可以同任何建树方法协同使用。目前,这个方法的局限因素在于程序生成模拟数据的可行性。有一个程序,能够在以下情况下模拟序列数据:模型包括两个取代类型(转化和颠换),碱基频率不相等,对于内部位点的速率差异设定或者没有设定gamma修正。这个程序可以在作者的Web站点上找到,这个站点由Berkeley维护(参见本章最后所附的Internet资源列表)。
似然比例实验
正如方法名称所暗示的那样,似然比例实验适用于ML
上一篇:多序列比对的实际应用 下一篇:利用蛋白质序列的预测方法
共45页: 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] 20 [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] 下一页