|
六、观察输出
在SeqLab期间运行程序产生的输出文件列于Output Manager窗口中(如图4.4所示)。
打开Output Manager窗口 的方式如下:
1。选取Windows菜单中的Output Manager选项。
这个窗口中列出的输出文件可以被显示或打印出来。单击Display按钮可以显示窗口中被加亮的那个文件。图4.4中给出了一个显示的输出文件的例子。单击Print按钮可以把选定的文件传送到网络打印机上。
对于以前启动的SeqLab运行进程间产生的输出文件必须列在Output Manager窗口中才能看到或打印出来。选取Add Text Files或Add Graphics Files按钮并且从出现的file browser中根据文件名选取相应文件。产生图形输出的程序将创建以.figure为扩展名的文件。当这种类型的文件被选中要进行显示,它会被转换使其可以显示在一个X-window中。当这种类型的文件被选中进行打印,它会根据选择的打印机及其设置被转换为PostScript或HPGL格式。
某些输出文件(序列文件,列表文件,MSF文件)可被加入SeqLab Main List或Editor中用作Wisconsin软件包程序的输入。如果在Output Manager窗口中选中这样一个文件,Add to Main List 以及Add to Editor按钮将处于激活状态(如图4.4所示)。如果选中的文件不能加入这些窗口中,这些按钮将处于非激活状态。
七、监视程序执行过程并解决问题
每次SeqLab进程执行期间运行的程序都记录在Job Manager窗口中(如图4.5所示)。这个窗口可从SeqLab Main Window的Windows菜单条中访问到。
Job Manager窗口的上半部分是所有当前SeqLab进程间运行的程序的事件记录。根据名称选中相应程序即可监视此程序的状态。如果一个程序因某种原因运行失败,会在这个窗口中出现一条消息,并在Output Manager窗口中出现这个程序的一个事件文件。从这个窗口中也可以终止正在运行的程序。
八、给序列加注释并在SeqLab Editor中图形化地显示注释。
SeqLab有一个独特的特征即它链接到数据库条目的特征表格(Features table)上。例如,核酸数据库的条目通常有关于位置、编码区、单独的内含子和外显子以及聚腺苷酸化位点的特征。SWISS-PROTPlus条目通常有关于已知蛋白质模式modif的位置、翻译后修饰位点以及二级结构的特征。这些特征可以在SeqLab Editor中通过涂色残基(Features Coloring)或示意图(Graphic Features)观察到。
选择特征显示方式的方法如下:
1。选定Display方式按钮中的Features Coloring。
2。选定Display方式按钮中的Graphics Features。
图4.6的上图给出了一组对比的数据库条目的图形特征显示的实例。SeaLab主窗口(图4.1)中的1:1滑动条可用于改变示意图的水平比例。
通过选取Windows菜单的Features选项可以显示一个条目的数据库特征。这一操作将打开一个Sequence Features窗口(图4.6)。用户可以选择观看所有的特征或是只看选中的那部分特征。在Sequence Features窗口上部区域选取一个特征时在下部区域中会显示关于这个特征的详细信息。双击一个条目中的一个特征也可以打开这个窗口。
SeqLab Editor另一个独特同时的也是非常有用的特征是可以增加特征或编辑现有特征。这一操作可以在Sequence Features和Feature Editor窗口中完成(图4.6)。
增加一个特征的方法如下:
1。用光标加亮一个区域(或在Feature Editor的文本框中From和To区域中填上起止范围)。
2。选中Windows菜单的Features选项。
3。在Sequence Features窗口中选中Add按钮。
4。在Feature Editor窗口中选中Shape and Color按钮。
5。在Feature Editor窗口的关键词文本框中键入特征名。
6。在Feature Editor出口的Comments域中键入详细的注释。
7。单击OK按钮和Close按钮。
编辑一个特征的方法如下:
1。选中Windows菜单的Features选项。
2。在Sequence Features窗口中选中要编辑的特征。
3。在Sequence Features窗口中选中Edit按钮。
4。修改Feature Editor窗口中的形状、颜色、范围、关键词或注释。
5。单击OK按钮和Close按钮。
九、在SeqLab Editor中保存序列
当用户退出SeqLab Editor模式或保存编辑的工作时,信息被保存在一个富含序列格式文件(RSF)中。这是一种新型文件,它包含了序列的参考信息和特征信息以及序列本身。RSF文件格式允许特征信息显示在SeqLab Editor中。RSF文件可以包含一个或多个序列条目。如果数据库条目被保存,这些条目的复制件(包括所有的参考信息和特征表格信息)都被包含在这个RSF文件中。以这种方式创建的RSF文件自动添加到显示在SeqLab List模式下的当前列表文件中并存储在用户的工作目录里。
十、在SeqLab中可以实现的分析实例。
SeqLab中可以使用多个序列分析程序的特性使用户可以应用这些程序顺序地回答相关问题或在对输入序列进行编辑后重复某项分析。而可以同时访问公用数据库和本机序列的优点使用户可以在一个分析中使用其中任意一种而不用先进行转换或格式化的工作。这一部分中介绍了6种用SeqLab可以解决的序列分析问题。
在两条mRNA中寻找开放阅读框架,翻译并对比RNA与蛋白质序列。
对两条相关的mRNA进行测序的用户可能希望寻找开放阅读框架(ORF)、翻译以及进行核酸与氨基酸序列间的两两对比。
把序列加入SeqLab Editor中,从Functions菜单中选中Map选项运行Map程序。Map输出文件包含了限制性酶切图和6种可能的翻译框架的ORF的显示。这些ORF的起始和终止位置可进行标记并选为SeqLab Editor中序列显示的范围,然后可用Edit菜单的Translate操作进行翻译。翻译结果自动出现在SeqLab Editor中。
两条相关的核酸或蛋白质序列可用Gap程序(Needleman and Wunsch, 1970)或BestFit(Smith and Waterman, 1981)程序进行对比。Gap程序寻找两条序列间的全局最优对比结果。适用于两条待比对的序列是进化相关的情况。BestFit程序寻找两条序列的局部最优对比结果,它适用于两条序列不是进化相关而是功能相关的情况。
通过参考搜索寻找数据库中的相关条目并进行对比
研究一个特征序列家族成员的用户可能希望寻找这个家族中的其它成员并建立它们的多序列对比。
从Functions菜单中选取LookUp程序。LookUp在数据库条目的参考信息部分搜索描述词并建立匹配条目的列表(Etzold and Argos, 1993; Etzold et al., 1996)。在参考部分的Definiton, Author, Keyword和Organism域中搜索描述词并在词之间使用“and”(&)、“or”(|)以及“but not”(!)布尔表达式。例如,在SWISS-PROT条目的Description域搜索“lactate & dehydrogenase & h & chain”将产生一个输出文件,其中列出了乳酸脱氢酶 H 链(lactate dehydrogenase H chain)条目。这个输出文件可以从Output Manager窗口中加以显示,然后与用户的序列一起添加到SeqLab Editor中。
要创建所有这些序列的多序列对比,只要根据序列名称选中这些序列并从Functions菜单中运行PileUp程序。由PileUp产生的多序列文件也列在Output Manager窗口中并可以直接添加到SeqLab Editor中。推荐采用这一步的原因在于数据库条目的特征表格(Features table)信息可与对比结果一起被包括进来。必要时对比结果是可以被编辑的,并且如果数据库条目有相似的特征,这些特征可被附加给用户序列。LookUp程序窗口,输出文件以及输出文件中的序列对比结果如图4.7所示。
用查询序列搜索数据库,将找到的条目与查询序列进行对比并产生进化系统树
克隆并测序一个未知功能基因的用户可能希望在一个数据库中搜索相似的序列。如果搜索到了,用户可能进一步希望创建与查询序列最相似的序列的多序列对比并产生数据的种系图。
往SeqLab Editor中添加一个查询序列并从Functions菜单中选取FASTA程序。FASTA程序(Pearson and Lipman, 1988)在数据库中搜索与查询序列相似的序列。输出文件可从Output Manager窗口中加以显示并直接添加到SeqLab Editor中。在这个输出文件中数据库条目与查询序列局部相似性最好的区域被加以标记。如果要显示的话,每个数据库条目只有这种区域可以显示在SeqLab Editor中。不要的条目可以从SeqLab Editor中一起被删除。
从Functions菜单中选中PileUp程序创建这些序列的多序列对比。输出可从Output Manager窗口中加以显示并添加到SeqLab Editor中更新已经存在的未对比序列。必要时可对这一对比结果进行编辑,并且数据库条目的有用的特征表格信息也可以添加给查询序列。
从Functions菜单中选取PaupSearch程序,程序提供了一个PAUP(进化系统简约性分析(Phylogenetic Analysis Using Parsimony))(Suofford, 1996)中树搜索方式的GCG接口。PaupDisplay程序为PAUP中的树操作,鉴定以及显示方式提供了一个GCG接口。FASTA搜索的输出,前6个序列的对比结果以及这一对比结果产生的进化树如图4.8所示。
拼接交叠序列片段产生一连续序列,寻找并翻译这一序列的编码区域并在数据库中搜索相似序列
克隆了一个基因,把它分解克隆为一组有交叠的序列片段并进行了测序的用户可能希望把这些序列片段重新组装为一条连续的序列。一旦contig拼接完成,用户可能希望在序列中寻找阅读框架,翻译并在数据库中搜索相似序列。
Fragment Assmbly System的程序可用于拼接交叠序列片段。GelStart程序创建一个项目。GelEnter程序把序列片段复制到项目中。GelMerge程序寻找片段之间的交叠并把它们拼接成contig。GelAssemble程序是一个编辑器,可用于编辑这些连续的部分并解决片段之间的冲突问题。所有这些程序都可以从Functions菜单中选取。一旦拼接完成,最终构成此contig的连续序列可以被保存为一个序列文件并添加到SeqLab Editor中。
使用Map、Frames、TestCode(Fiekett, 1982)或Codon Preference(Gribskov et al., 1983)程序可预测序列中的编码区(所有这些程序可以从Functions菜单中选中)。使用Edit菜单的Select Range功能选择这些程序预测的区域并使用Edit菜单中的翻译操作把它们翻译为蛋白质。这些提出的翻译区域也可以作为核酸共有序列的特征被加入。
选取蛋白质序列然后选择Functions菜单中BLAST(Altschul et al., 1990)。BLAST程序在数据库中搜索与查询序列相似的条目,此程序既可以进行远程搜索也可以进行本机搜索。搜索结果可以从Output Manager窗口中加以显示。如果被搜索的是一个本机的数据库,结果文件可以加入SeqLab Editor或Main List窗口中,并允许对找到的序列进行进一步分析。
对比相关的蛋白质序列,计算对比结果的共有序列,辨识序列中新的特征序列模式,在数据库中搜索包含此模式的序列或在对比结果的共有序列中搜索已知的蛋白质模式
辨识了一组相关序列的用户可能希望对其进行对比并计算对比结果的共有序列。如果可以在对比结果中找到保守模式,用户可能希望在数据库中搜索包含这种模式的其它序列。用户可能还希望在计算出的共有序列搜索已知的蛋白质模式。
选取待对比的序列,从Functions菜单中选取PileUp程序创建多序列对比,PileUp程序的输出文件可从Output Manager窗口中加以显示并添加到SeqLab Editor中。用户可以对对比结果的某个区域重新加以对比并以此替换原有的对比结果。只要选取一个区域并重新运行PileUp即可。从PileUp Options窗口中选取"realign a portion of an existing alignment(重新对比一个已存在的对比结果的一部分)",这可能有利于选择一个替代评分矩阵或不同的创建和扩展处罚。新的输出文件将包含最初的对比结果以及替换原始对比结果的重新对比的区域。
用Edit菜单中Consensus操作计算对比结果的共有序列。如果保守模式可被辨识,从Functions菜单中选取FindPatterns选项。从共有序列中剪切下此特征序列模式并把它粘贴到FindPatterns模式选择器中,并在数据库中搜索包含这一模式的序列。
此外,运行Motif程序可在共有序列中搜索已知的蛋白质模式。Motif在蛋白质序列中搜索在PROSITE,蛋白质位点和模式的PROSITE字典中已知的蛋白质模式(Bairoch et al., 1997)。如果辨识出一个Motif,则给所有序列增加一个特征,并标出它的位置。图4.9显示了一个蛋白质序列的匹配、一个共有序列以及Motif搜索的结果。
使用Profile进行相似性搜索并对比相关序列
序列分析的一个新的扩展领域是Profile技术。一个profile是一个位置特定的评分矩阵,它包含了一个序列对比结果中每个位置的所有残基信息。这一点与共有序列不同,共有序列中只包含每个位置的保守残基的信息。Profile做好后可用于搜索数据库、数据库划分或在一个集合中搜索与原始对比结果中的序列相似的序列。它也可以用于把一条单独的序列与一个对比结果进行对比。
使用ProfileMake程序(Gribskov et al., 1987,1990)可创建一个序列对比结果的profile。使用ProfileSearch程序可用profile对数据库进行搜索,ProfileSegment程序可以显示搜索结果(Gribskov et al., 1987,1990)。使用ProfileGap程序可将一个序列与profile进行对比(Gribskov et al., 1987,1990)。ProfileMake, ProfileSearch, ProfileSegments以及ProfileGap程序都可以从Functions菜单中启动。
上一篇:结构数据库 下一篇:生物数据库的信息检索
共3页: 上一页 [1] 2 [3] 下一页 |