|
低复杂度区域
不管是蛋白还是核酸都包含一些偏颇的区域,在进行序列数据库搜索时这些区域可能会导致一些令人迷惑的结果。这些低复杂度区域(LCRs)在从明显的同性聚合顺串和短周期重复到更精细的情况(如其中某些或一些残基过多表现)的范围内变化。一个称为SEG的程序发展起来,目的是要把一个蛋白质序列分解为低复杂度和高复杂度组成的各个片段(Wootton and Federhen, 1993, 1996)。这个程序的结果表明数据库中的蛋白质有一半以上拥有至少一个LCR(Wootton and Federhen, 1993; Wootton, 1994)。LCRs的进化、功能和结构性质并没有被很好地了解。在DNA中,有许多种简单的重复,其中一些已经知道是高度多样性的,并且在作基因图谱时经常使用的。它们源起的机制可能是聚合酶滑动、偏颇核苷酸取代或者不等交换。LCRs更偏好于在结构上以非球形区域的形式存在,那些在物理化学上已经被定义为非球形的区域通常可以在使用SEG程序时获得较好的结果(Wootton, 1994)。
对于包含LCR的序列进行比对是成问题的,因为这些序列不符合残基-残基序列守恒的模型。有些时候,与功能相关的属性可能仅仅是周期性或组成结构,而不是任何特异的序列。而且,对比对作统计学显著性分析的方法是建立在一定的随机概念基础上的,LCR显然不符合这一条件,因此,对于一个包含LCR的查询序列,在进行数据库搜索的输出里会发现很多不正确的条目,因为这些匹配的显著性被过高评价了(Altschul et al., 1994)。这个问题大体上可以通过过滤(或者叫屏蔽)解决,操作是这样的,把有问题的子序列转化为不明确的字符(蛋白质用X,核酸序列用N),这样它们就不会对比对贡献正分了。
果蝇鳞甲基因产物的人类同源物就是包含LCR蛋白质的一个好例子,在用SEG分析的时候,两个低组成复杂度的序列区域被鉴定出来。图7.13a显示了缺省的树输出,其中低复杂度序列用小写字母表示在左边,高复杂度序列在右边用大写字母表示。第一个区域片段有61个残基,包含大量丙氨酸(alanine)和谷氨酸盐(glutamine)的多聚物;第二个区域片段有14个残基,偏向于精氨酸(arginine)。如果不进行过滤的话,许多包含这种偏向性序列的数据库序列都会被报告出来。使用命令行选项,SEG程序就会产生一个过滤后的查询序列版本。另外,过滤可以有BLAST程序自动完成,如果使用合适的参数。请注意在使用BLAST时,缺省情况下就可以实行过滤(比如在WWW版本)。这就解释了为什么查询序列中的不明确的字符串(在原序列中没有出现)会在比对中被偶然发现。
a
>gi|1703441|sp|P50553|ASH1_HUMAN ACHAETE – SCUTE HOMOLOG 1
1-11 MESSAKMESGG
agqqpqpqpqqpflppaacffataaaaaaa 12-72
aaaaaaqsaqqqqqqqqqqqqqqapqlrpa
a
- DGQPSGGGHKSAPKQVKRQRSSSPELMRCK
aavarrnerernrv 120-133
- KLVNLGFATLREHVPNGAANKKMSKVETLR
TISPNYSNDLNSMAGSPVSSYSSDEGSYDP
LSPEEQELLDFTBWF
b
>gi|1703441|sp|P50553|ASH1_HUMAN ACHAETE – SCUTE HOMOLOG 1
MESSAKMESGGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXDGQPSGGGHKSAPKQVKRQRSSSPELMRCKRRLNFSGFGYSLPQQQPX
XXXXXXXXXXXXXKLVNLGFATLREHVPNGAANKKMSKVETLRSAVEYIRALQQLLDEHD
AVSAAFQAGVLSPTISPNYSNDLNSMAGSPVSSYSSDEGSYDPLSPEEQELLDFTBWF
c
>gi|540240 (U14590) achaete – scute homolog b [ Danio rerio ]
Length – 195
Score – 193 bits (512), Expect – 7e-49
Identities – 107/155 (69%), Positives – 118/155 (76%)
Gaps – 8/155 (5%)
QUERY 86 KQVKRQRSSSPELMRCKRRLNFSGFGYSLPQQQPXXXXXXXXXXXXXXKLVNLGFATLRE 145
K +KRQRSSSPEL+RCKRRL F+G GY++PQQQP K VN+GF TLR+
540240 32 KVLKRQRSSSPELLRCKRRLTFNGLGYTIPQQQPMAVARRNERERNRVKQVNMGFQTLRQ 91
QUERY 146 HVPNGAANKKMSKVETLRSAVEYIRALQQLLDEHDAVSAAFQAGVLSPTISPNYSNDLNS 205
HVPNGAANKKMSKVETLRSAVEYIRALQQLLDEHDAVSA Q GV SP++S YS
540240 92 HVPNGAANKKMSKVETLRSAVEYIRALQQLLDEHDAVSAVLQCGVPSPSVSNAYS----- 146
QUERY 206 MAG—SPVSSYSSDEGSYDPLSPEEQELLDFTNWF 238
AG SP S+YSSDEGSY+ LS EEQELLDFT WF
540240 147 -AGPESPHSAYSSDEGSYEHLSSEEQELLDFTTWF 180
图7.13、使用SEG程序检索低复杂度区域:使用SEG程序对人类achaete-scute蛋白(Swiss-Prot P50553)进行分析,发现了两段低复杂度区域。(a).以缺省的“tree”格式执行程序得到的输出结果,左边用小写字母显示了低复杂度区域,右边用大写字母显示了高复杂度区域。 (b) .开启-x命令行开关,SEG程序将会产生把低复杂度区域屏蔽掉的序列结果。 (c).为了方便使用,操作者可以使用BLAST程序来进行低复杂度区域的屏蔽。当一个低复杂度区域被屏蔽掉的序列作为查询序列被提交给数据库进行检索时,在BLASTP输出结果的比对中可能也会包括一些被屏蔽的分段序列。
重复元件
如果查询中包括一个重复元件的序列-比如说一个Alu重复-可能会出现许多错误的和令人费解的结果。虽然在蛋白质-蛋白质搜索中,这一般不会成为什么大问题,但是在包含DNA序列任何比较中,都必须对此引起必要的重视。基因组序列可能会包含大量分散的重复序列,特别是一些多基因族(例如Alus, LINEs和人的序列中的MERs),甚至mRNA序列中也可能含有重复序列,几乎都是信息的非翻译区。因此,重复元件在数据库序列中非常普遍,如果查询序列中也有这些重复,就会在比对中出现大量不正确的正分。虽然重复元件显示了大量不同成分,仍然有足够的相似性使比对具有一定的高显著性。虽然比对会跨越这些重复而不是侧面的单一序列,但是直接从数据库搜索的输出结果观察,这并不是显而易见的。
GenBank和Swiss-Prot数据库中都包含一些“暖序列(warming sequence)”,这些数据向使用者指出查询中包含重复序列(Claverie and Makalowski, 1993)。在GenBank中,这些条目表示了人类Alu重复的不同亚科的一致序列;在Swiss-Prot中的类似条目是Alu序列的六种翻译框架(一个接着一个,中间由若干X分隔)。在两种情况下,单词“WARNING”在定义行中非常显著。暖序列不必出现在命中列表的上方,而且,可以有许多包含Alu重复的数据库序列同查询序列非常相似,甚至比查询序列同暖序列还相似。这在图7.14a中有所体现,它显示了对人类转录因子CBFB(在3’UTR包含一个Alu)基于nr数据库进行一次blastn搜索的一部分命中。暖序列(用箭头标出)位于命中列表的第31位。虽然列表顶部的一些匹配显示了真正的关系(第一个是一个自命中),绝大多数只是因为具有Alu重复才会出现错误的正分。
在查询中更直接地检测Alu重复是否存在的方法就是在查询前先对alu数据库做一次搜索。如图7.14b所示,做完这个以后,包含alu的暖序列作为最高分匹配被报告出来。如果查询序列被发现包含重复元件,接下来的行动就是要对这个序列进行编辑改动,把它剔除或者屏蔽掉。在这里一个有用的工具就是CENSOR,它能够自动检测并且消除重复元件。
a
Smallest
Sum
High Probability Y
Sequences producing High – scoring Segment Pairs: Score P(N) N
gb|L20298|HUMCBFB Homo sapiens transcription factor... 8691 0.0 2
dbj|D14571|MUSPEBP2B2 Mouse mRNA for PEBP2B2 protein, co.. 2574 0.0 25
gb|L032791|MUSP215CBF Mus musculus core – binding factor m 2574 0.0 25
dbj|D14572|MUSPEBP281 Mouse mRNA for PEBP2B1 protein, co.. 2130 0.0 26
dbj|d14570|muspebp283 Mouse mRNA for PEBP2B4 protein, co.. 1701 0.0 26
gb|L03305|MUSCBFAA Mus musculus core – binding factor m 942 0.0 27
gb|L03306|MUSCBFAB Mus musculus core – binding factor m 2130 1.6e-282 10
gb|U22177|DMU22177 Drosophila melanogaster Big brothe... 382 1.5e-37 2
emb|Y10196|HSPEX H.sapins PEX gene 400 4.4e-22 1
gb|L77570|HMUDGCRCEN Homo sapiens DiGeorge syndrome cri... 409 6.7e-22 2
gb|AD00067|1010603 Homo sapiens DNA from chromosome 1... 392 2.0e-21 1
emb|Z83822|HS306D1 Human DNA sequence from PAC 306D1 ... 392 2.0e-21 1
emb|Z82097|HSF77D12 Human DNA sequence from fosmid F77... 391 2.5e-21 1
dbj|D42052|HUMKIAA000 Human cosmid Q7A10 (D21S246) inser... 391 2.5e-21 1
gb|U83511|HSUB3511 Human Xp22 cosmids U177G4,U152H5, ... 386 6.5e-21 1
gb|U52112|HSU52112 Human Xq28 genomic DNA in the regi... 386 6.5e-21 1
gb|S83170|S83170 tissue – type plasminogen activator.. 382 1.1e-20 1
emb|X9642|HSCAMF3X1 H.sapiens Y chromosome cosmid CAMF... 383 1.1e-20 1
gb|U95739|HSU95739 Human chromosome 16p11.2 – p12 BAC c. 383 1.1e-20 1
gb|95743|HSU95743 Human chromosome 16p13.1 BAC clone... 383 1.1e-20 1
gb|U91322|HSU91322 Human chromosome 16p3 BAC clone C.... 383 1.1e-20 1
gb|U82609|HSU82609 Human centromere – specific histone.. 382 1.3e-20 1
gb|AC001061|HSAC001061 Homo sapiens (subclone 2_g6 fromP.... 382 1.3e-20 1
emb|Z46940|HSPRMTNP2 H.sapiens PRM1 gene, PRM2 gene and... 382 1.4e-20 1
gb|K03021|HUMTPA Human tissue plasminogen activator... 382 1.4e-20 1
gb|U15422|HSU15422 Human protamine 1 (PRM1), protamin... 382 1.4e-20 1
gb|U91323|HSU91323 Human chromosome 16p13 BAC clone C... 382 1.4e-20 1
emb|Z54147|HSLI29H7A Human DNA sequence from cosmid L12... 381 1.7e-20 1
emb|Z82194|HSJ272J12 Human DNA sequence fom clone J272J12 374 1.7e-20 2
dbj|D0035|HIV2CAM2 Human immunodeficiency virus type-... 380 2.0e-20 1
à gb|U14567|HSU14567 ***ALU WARNING: Human Alu_J subfam... 373 2.4e-20 1
gb|L81578|HSL81578 Homo sapiens (subclone 2_b2 from P... 386 3.0e-20 2
gb|L81854|HSL81854 Homo sapiens (subclone 2_b8 from P... 377 3.4e-20 1
b
Smallest
Sum
High Probability Y
Sequences producing High – scoring Segment Pairs: Score P(N) N
à lcl|HSU14567 ***ALU WARNING: Human Alu – J subfamil... 373 4.1e-24 1
lcl|unknown gb|M94643_HSAL001949 349 1.4e-22 1
lcl|HSU14574 ***ALU WARNING: Human Alu – Sx subfami... 347 7.0e-22 1
lcl|HSU14573 ***ALU WARNING: Human Alu – Sq subfami... 347 7.0e-22 1
lcl|unknown gb|Z15026_HSAL001005 (Alu – J) 324 1.4e-21 1
lcl|unknown gb|M15657_HSAL001254 (Alu – J) 337 6.3e-21 1
lcl|unknown gb|M61839_HSAL002304 (Alu – J) 314 6.6e-21 1
lcl|unknown gb|X17354_HSAL000525 (Alu – J) 329 6.6e-21 1
lcl|HSU14572 ***ALU WARNING: Human Alu – Sp subfami... 329 2.4e-20 1
lcl|unknown gb|J03619_HSAL001939 (Alu – Sx) 329 2.8e-20 1
lcl|unknown gb|L11910_HSAL002838 (Alu – J) 307 2.8e-20 1
lcl|unknown gb|M11228_HSAL002744 (Alu – Sp) 329 2.9e-20 1
lcl|unknown gb|L18035_HSAL004322 (Alu – J) 318 9.3e-20 1
lcl|unknown gb|L05367_HSAL002551 (Alu – J) 318 1.0e-19 1
lcl|unknown gb|M58600_HSAL002004 (Alu – J) 322 1.2e-19 1
lcl|unknown gb|Z23796_HSAL005276 (Alu – J) 306 1.7e-19 1
lcl|unknown gb|M90058_HSAL002955 (Alu – J) 294 2.5e-19 1
lcl|unknown gb|D14642_HSAL003786 (Alu – J) 315 4.0e-19 1
lcl|unknown gb|M29038_HSAL002942 (Alu – J) 314 5.5e-19 1
lcl|unknown gb|M92357_HSAL001387 (Alu – J) 310 9.8e-19 1
图7.14、反复元件可能会导致令人迷惑的结果:本次blastn查询使用的查询序列是人类转录因子CBFB(GenBank L20298)的cDNA序列。(a).如果使用nr数据库,最先的一些匹配同查询序列具有真正的关联,但是也会报告许多不正确的命中结果,这些命中分布于各个人类染色体的基因组区域。在这个命中列表中,打箭头处(位于第31行)的一致的Alu-J序列被列为警告序列。 (b).如果使用alu数据库,Alu-J警告序列就成了最佳匹配序列。
为了鉴定这些潜在的搜索成果,学会怎样评估搜索结果非常重要。上述的一些策略只应用于Alu反复,它是人类以及其它一些物种中出现频率最高的,但是其它一些反复仍然存在,虽然含量较低,而且,其它物种会显示出完全不同类型的反复元件。现在有一个数据库搜索输出的附加性质,它可以指示出反复元件。例如,注意比对中与DNA序列编码区域相关的位点是非常有益的。如果非编码区域匹配而编码区域不匹配,那么反复序列就很令人怀疑;如果查询序列同大量序列匹配,但是这些序列相互之间没有什么关系,但是比对的分值都很相近,这样的结果就极为可疑。例如图7.14a中,许多匹配的相似性分值都几乎一样,而且包括了从若干不同的人类染色体上来的质粒。虽然对这个发现有很多解释,但是一个明智的看法就是至少承认这个现象可能是出于外界因素(如反复元件的存在)的影响。
小结
在世界各地科学家们每天都要执行序列比对和数据库搜索成千上万此,并且所有的分子生物学都应该熟悉这些要紧的工具。这些方法注定要不断发展,并且接受不断增长的数据库容量的挑战。特别是当可利用的信息增长时,使用者更加难以解释其结果。数据库搜索工作台致力于事后处理搜索结果并且图形显示,从而解决这一问题。这些策略的例子包括PowerBLAST(Zhang and Madden, 1997),BLIXEM(Sonnhammer and Durban, 1994)和BEAUTY(Worley et al., 1995)。
这一章描述了数据比较的一些基本概念,但是使用大量不同的程序以获得更详尽的信息非常有用。研究人员应该了解程序工作的基本操作,并且选择相应的参数。此外,他们应该了解潜在的外部影响并且知道如何避免。最重要的是,应该结合实验方法的发现和评估事物的强大威力。
第七章中涉及到的可以在互联网上使用(获得)的软件:
|
CULSTAL.W
|
ftp://ftp.ebi.ac.uk/pub/software/
|
|
DOTTER
|
ftp://ftp.sanger.ac.uk/pub/dotter/
|
|
LALIGN.FASTA
|
ftp://ftp.virginia.edu/pub/fasta/
|
|
BLAST
|
ftp://ncbi.nlm.nih.gov/blast/
|
|
SEG
|
ftp://ncbi.nlm.nih.gov/pub/seg/
|
参考文献:
Altschul.S.I : (1991).Amino acid substitution matrices from an information theoretic perspective. J.Mol.Bio. 219. 555-565.
Altschul.S.E. and Erickson.B.W. (1985). Significance of nucleotide sequence alignments: A method for random sequence permutation that preserves dinucleotide and codon usage. Mol.Biol.Evol. 2. 526-538.
Altschul.S.E. and Erickson.B.W. (1986). Locally optimal subalignments using nonlinear similarity functions. Bull.Math.Biol. 48. 633-660.
Altschul.S.E and Gish.W. (1996). Local alignment statistics. Methods Enzymol. 266. 460-480.
Altschul.s.E., Gish.W., Miller.W., Myers.E.W., and Lipman.D.J. (1990). Basic local alignment search tool. J.Mol.Biol. 215. 403-410.
Altschul.S.E., Boguski.M.S., Gish.W., and Wootton.J.C. (1994). Issues in searching molecular sequence databases. Nature Genet. 6. 119-129.
Altschul.S.e., Madden.T.L., Schaffer. A.A., Zhang.J., Zhang.Z., Miller.W., and Lipman.D.J. (1997). Gapped BLAST and PSI-BLAST: A new generation of protein database search programs. Nucl.Acids.Res. 25. 3389-3402.
Baron.M., Norman.D.G., and Campbell.I.D. (1991). Protein modules. Trends Biochem.Sci. 16. 13-17.
Chandrasekharappa.S.C., Guru.S.C., Manickam.P., Olufemi.S.E., Collins.E.S., Emmert-Buck.M.R., Debelenko.I..V., Zhuang.Z.., Lubensky.I.A., Liotta.L.A., Crabtree.J.S., Wang.Y., Roe.B.A., Weisemann.J., Boguski.M.S., Agarwal.S.K., Kester.M.B., Kim.Y.S., Heppner.C., Dong.Q., Spiegel.A.M., Burns.A.L., and Marx.S.J. (1997). Positional cloning of the gene for multiple endocrine neoplasia- Type 1.Science 276. 404-407.
Clavrie.J.M., and Makalowski.W. (1993). Alu alert.Nature. 371. 752.
Dayhoff.M.O., Schwartz.R.M., and Orcutt.B.C. (1978). A model of evolutionary change in proteins . In Atlas of Protein Sequence and Structure. M. O. dabhoff. ed. (Washington.DC: National Biomedical Research lFoundation). pp. 345-352.
Doolittle.R.J., and Bork.P. (1993). Evolutionarity mobile modules in proteins. Sci Am. 269. 50-56.
Doolittle.R.F., Hunkapiller.M.W., Hood.L.E., Devare.S.G., Robbins.K.C., Aaronson.S.A., and Antoniades.H.N. (1983). Simian sarcoma virus onc gene, v-sis, is derived from the gene (or genes) encoding a platelet-derived growth factor. Science 221. 275-277.
Fitch.W.M. (1969). ocating gaps in amino acids sequences to otimize the homology between two proteins. Biochm.Genet.3. 99-108.
Fitch.W.M. (1983). Random sequences.J.Mol.Biol. 163. 171-176.
Gibbs.A.J., and Melntyre.G.A. (1970). The diagram: A method for comparing sequences. Its use with amino acid and nucleotide sequences. Eur.J.Biochem. 16. 1-11.
Gonzalez.P., Hemandez-Calzadilla.C., Rao.P.V., Rodriguez.I.R., Zigler.J.S., Jr., and Borras. T. (1994). Comparative analysis of the zeta-crystallin/quione reductase gene in guinea pig and mouse. Mol.Biol.Evol. 11. 305-315.
Henikoff.S., and Henikoff.J.G. (1991). Automated asscembly of protein blocks for database searching. Nucl.Acids.Res. 19. 6565-6572.
Henikoff.S., and Henikoff.J.G. (1992). Amino acid substitution matrix from protein blocks. Proc.Natl.Acad.Sci. U.S.A. 89. 10915-10919.
Higgins.D.G., Thompson.J.D., and Gibson.T.J. (1996). Using CLUSTAL for multiple sequence alignments. Methods Enzymol. 266. 383-402.
Holm.L.., and Sander.C. (1997). Enzyme HIT. Trends Biochem.Sci. 22. 16-117.
Huang.X., Hardison.R.C., and Miller.W. (1990). A space-efficient algorithm for local similarities. Comput.Appli.Biosci. 6. 373-381.
Jurka.J., Klonowski.P., Dagman.V., and Pelton.P. (1996). CENSOR: A program for identification and wlmination of repetitive elements from DNA sequences. Comput.Chem. 20. 119-122.
Karlin.S., and Altschul.S.F., (1990). Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes. Proc.Natl.Acad.Sci. U.S.A. 87. 2264-2268.
Karlin.S., and Altschul.S.E. (1993). Applications and statistics for multiple high-scoring segments in molecular sequences. Proc.Natl.Acad.Sci. U.S.A. 90. 5873-5877.
Lipman.D.J., and Pearson.W.R. (1985). Rapid and sensitive protein similarity searches. Science . 227. 1435-1441.
Needleman.S.B., and Wunsch.C (1970). A general method applicable to the search for similarities in the amino acid sequence of two proteins. J.Mol.Biol. 48. 443-453.
Patthy.L., (1991). Modular exchange principles in proteins. Curr.Opin.Struct.Biol. 1., 351-361.
Pearson.W.R. (1996). Effective protein sequence comparison. Methods Enzymol. 266. 227-258.
Pearson.W.R., and Lipman.D.J. (1988). Improved tools for biological sequence comparison. Proc.Natl.Acad.Sci. U.S.A. 85. 2444-2448.
Smith.T.F., and Waterman.M.S. (1981). Identification of common molecular subsequences. J.Mol.Biol. 147. 195-197.
Smith.T.F. Waterman.M.S., and Burks.C. (1985). The statistical distribution of nucleic acid similarities. Nucl.Acids.Res. 13. 645-656.
Sonnhammer.E.L..L., and Durban.R. (1994). A workbench for large scale sequence homology analysis. Comput.Appl.Biosci. 10. 301-307.
Sonnhammer.E.L..L.., and Durban.R. (1996). A dot-matrix program with dynamic threshold control suited for genomic DNA and protein sequence analysis. Gene 167. GCI-10.
Waterfield.M.D.., Scrace.G.T.., Whittle.N.., Stroobant.P.., Johnsson.A.., Wasteson.A.., Westermark.B.., Heldin.C.H.., Huang.J.S.., and Deuel.T.F. (1983). Platelet-derived growth factor is structurally related to the putative transfoming protein p28sis of simian sarcoma virus. Nature. 304. 35-39.
Waterman.M.S.., and Eggert.M. (1987). A new algorithm for best subsequence alignments with applications to tRNA-rRNA comparisons. J.Mol.Biol. 197. 723-728.
Waterman.M.S.., and Vingron.M. (1994). Rapid and accurate estimates of statistical significance for sequence database searches. Proc.Natl.Acad.Sci. U.S.A. 91. 4625-4628.
Wilbur.W.J.., and Lipman.D.J. (1983). Rapid similarity researches of nucleic acid and protein data banks. Proc.Natl.Acad.Sci. U.S.A. 80. 726-730.
Wootton.J.C. (1994). Non-globular domains in protein sequences: Automated segmentation using complexity measures. Comput.Chem. 18. 269-285.
Wootton.jJ.C.., and Federhen.S. (1993). Statistics of local complexity in amino acid sequences and sequence databaseas. Comput.Chem. 17. 149-163.
Wootton.J.C.., and Federhen.S. (1996). Analysis of compositionally biased regions in sequence databases. Methods Enzymol. 266. 554-571.
Worley.K.C.., Wiese.B.A.., and Smith.R.F. (1995). BEARTY: an enhanced BLAST-based search tool that integrates multiple biological information resources into sequence similarity search results. Genome Res. 5. 173-184.
Zhang.J.., and Madden.T.L.. (1997). PowerBLAST: A new network BLAST application for interactive or automated sequence analysis and annotation. Genome.Res. 7. 649-656.
上一篇:NCBI 数据模型 下一篇:多序列比对的实际应用
共3页: 上一页 [1] [2] 3 下一页 |