PHYLIP, GCG-MSF, NBRF-PIR, HENNIG86数据格式以及文本比对(形如“{ name } <tab or space> { same-length sequences } <ret>”的列表,以“;<ret> end”结束)。Sequencher(基因密码有限公司)和Sequin程序可以输出NEXUS格式。其它格式的比对序列(CLUSTAL, FASTA, GDE等等)可以通过ReadSeq程序将其转化为NEXUS格式。如果使用ReadSeq程序,必须为每个单独的序列(分类单元)设计一个不超过八个字符的名字,因为程序会自动截取过长的名字。PAUP中的名字可以无限长,但是每一个名字必须唯一。比对块(比方说,就像MSF文件)可以由空格分开,作为更好的跟踪序列的位置。比对可以是连续的,也可以是较差存取的。PAUP文件中可以在方括号中写明注解和注释(比方说,比对中基本位置的标记)。PAUP可以识别IUPAC核苷酸的模糊密码,但是这些密码在进行距离和ML分析时被看作是丢失的数据。
PAUP文件中的数据块可以包含附加的最优化信息,比如特征符和序列标签,丢失数据的定义以及特征符集和特征符权重集的定义;其语法同PAUP 3.0相同,并且可以通过帮助文档进行交互式查询。一个PAUP文件还可以包含假定和进化树块。这些块的格式同MACCLADE程序所使用的格式基本相同,只有若干差异(Maddison and Maddison, 1992);举个例子,MACCLADE不能识别空位模式,而空位模式在MP分析中将会把空位看作是附加的特征符状态(FORMAT<space>GAP= { character } <space> GAPMODE=newstate<space> { other format options };)。同样地,PAUP会忽略一些MACCLADE数据选项。
在某些情况下,很南对数据进行手工格式化,这时就可以用菜单界面或者交互式的MACCLADE程序输出正确的格式文件。举个例子,可以通过PAUP菜单界面创建“假定集”。假定中可以包含一个外围集团的说明规范、特定分类群的排除以及特征符,如果是MP分析,还可以包含特征符权重和特征符类型的说明规范。假定还可以存储为一个合适的格式文件;打开一个数据文件的时候,就可以加载这个文件,或者,可以把注释粘贴到一个早先创建的文件中,以避免在并发的通话中需要将其加载。
PAUP也可以读取PHYLIP进化树的描述(从PHYLIP或者CLUSTAL输出),其中所提供的数据将被粘贴到一个NEXUS
上一篇:多序列比对的实际应用 下一篇:利用蛋白质序列的预测方法
共45页: 上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] 25 [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] 下一页