基因重复
基因重复或称复制基因(英语:Gene duplication (or chromosomal duplication or gene amplification))是指含有基因的DNA片段发生重复,可能因同源重组作用出错而发生,或是因为反转录转座(retrotransposition)与整个染色体发生重复所导致[1]。不过这些基因的复制品通常可幸免于大自然选择压力,也就是说,这类突变在生物体中一般无负面的影响。不过也因为带了更多基因需要拷贝,也因此过程中发生出错突变的速度高于有功能的单一版本基因。
综上所述,基因重复在演化过程中会扮演重要角色,近百年中受到科学界中许多成员的支持[2]。大野干在1970年的著作《基因重复造成的演化》(Evolution by gene duplication)中发展了这个理论[3]。复制基因在植物尤其重要。因为在植物中,无论是单基因,线粒体,或全基因体,复制是推动其全基因体演化的主要力量[4]。此外科学家认为,酵母菌的整个基因组,在1亿年前经历了重复作用[5]。植物体内也常见基因组的完整重复现象,例如小麦的6倍体,就是6个基因组的复制品。
由基因体复制而来的演化是一种天择的机制,许多新物种因此产生。复制基因被公认为是一种演化的表现,因为它是一个在细胞内随机发生的突变事件,其中的DNA复制品会因此延续,而且所有的基因都在上面,也就是完全的复制。由这种复制而来的两段基因会遗传给在这细胞中全部的后代,而也导致了这段基因比较容易发生再次突变或受到天择。分子演化学的中心学说,说明了几乎每段基因都会因为现有的基因,而受到强烈的天择压力,但复制基因却少受到此压力的影响,因此可以累积许多突变后产生的新功能。
基因重复在演化事件中所扮演的角色
重复的基因会导致基因体额外的复制,且不会受到天择压力的调控。其中有一种观点认为,基因重复使得基因体的复制发生突变之后,并不会对生物体产生负面的影响。这种新基因的突变而产生的结果,可能会增加生物体的适存度,或是新的基因片段功能,产生适应性基因重复(adaptive gene duplications)。最著名的例子就是在极地生活的冰鱼(Dissostichus mawsoni),其中的消化基因因为发生基因重复的突变,而导致基因有了抗冻蛋白()的表达功能[6]。另一种观点认为,两种复制的基因同样都会累积退化的突变,基因重复的缺陷也能相辅相成。这会导致复制基因中性的次功能化(),以及DDC模式(duplication-degeneration-complementation model)的产生,此种模式预期复制后的重复基因在不同调节片段可能发生失去功能的突变,导致重复基因彼此之间必须相互辅助另一个重复基因缺少的功能,因此两个复制的基因都必须被保留。
从生物体的结构来看,蛋白质和DNA序列的同源性是根据共同祖先的来源而定义的,无论是因为物种种化()而产生了直系同源()的基因序列,或是因为基因重复(duplication event)而产生了旁系同源的基因序列,来自共同祖先但却不相同的DNA片段可能有这两种序列
。重复事件来自相同祖先物种的但却不同物种种直系同源的基因序列,在经过基因重复之后,所转译出的蛋白质会有类似的功能或结构。相较之下,旁系同源的基因序列所转译出的蛋白质则不一定有类似的功能,尽管它们出自于同一种祖先物种,仍会演化出新的功能。
在生物学的研究当中,区分旁系同源与直系同源的基因序列是非常重要的(也相当困难),利用人类的基因进行功能性的实验往往都能在其他物种上成功试验,前提是必须在该物种的基因体内找到和人类来自相同的同源序列,而且是直系同源的基因序列,才能成功的进行试验。如果该序列是来自从基因重复事件的旁系同源,该物种与人类的功能就会有非常大的不同。由一个或多个重复基因组成的基因家族可能会被跳跃基因(transposable elements)影响,显著地造成重复基因之间序列的变异,最后造成趋异演化()。这也可能会因为序列的产生很大的变化,给予了同源的重复基因之间转换的机会。
产生基因的机制
在一段DNA序列中,利用基因的特征与该物种缺乏的基因序列,和相对应的区域特征进行比较,可以推测出是哪种机制造成此序列的产生[7]。最常见的过程为基因利用重复而产生的机制,以DNA或RNA为基础的重复机制都能产生新的基因[8]。
以DNA为基础的复制机制一般包含不对等联会(),可能会导致在原先存在的多基因族中,基因复制数量的膨胀。不对等联会也会在反复因子(Repetitive elements)中发生,像是跳跃基因()会导致非同源染色体上单复制基因的重复,以及复制基因的插入[9]。以RNA为基础的复制机制,或是反转录复制(retroduplication),会发生在一个已经转录好的mRNA要被反转录并插入到新的基因体位置上。一个基因的产生,也可以由两个完全不同基因的融合(Gene fusion)而形成一个新的镶嵌基因,或是利用原先存在的外显子()的增加与重新排列而得到新的基因[10]。
复制基因对演化的短期影响
有许多演化现象是借由复制基因而产生的()。现存许多利用基因复制的机制来解释新功能及蛋白质产物如何出现的假说。虽然每一假说都能给予一些解释,但对它们相对的重要性却仍不了解。
基因的保存
虽然复制基因只会发生在单一细胞中(无论是单细胞生物或是生殖细胞),但其仍要和其他无复制基因的细胞抗衡。若是这复制影响了细胞原本的功能,该细胞的适存度或生殖成功率则会比其他竞争对手还低,导致快速的死亡。而若此复制基因对适存度无影响,则就会在这族群中留存下来。在某些例子中,复制基因会甚至马上会对细胞的适存度有着正面的影响。
剂量效应(Dosage effects)
剂量这个名称的由来,是因为取决于单位时间内每一个细胞中,能复制出的mRNA和其转录出蛋白质分子的数量。若是基因产量小于理想产量,则引发出下列两种突变来增加其蛋白质产量。
- 使启动子突变以增加基因表现量。
- 利用基因重复增加可被转录的基因量。拥有越多的重复基因越可以在同一时间拥有较多的基因产物。假设基因表达没有一个负回馈的调控,基因产物就会随着每一次的基因重复而增加,直到蛋白质产物达到上限为止。
此外,在正向选汰(positive selection)的正回馈中,重复的基因可能马上会对族群量产生有利条件或是使得族群量增加。在这种情形中,就不需要以突变来保存基因。但是久而久之,突变却仍可能发生,使基因产生了不同的功能。
剂量效应也可能择汰掉产生重复基因的细胞。举例来说,当一细胞中的新陈代谢网络很和稳定时,它只能承受一些数量的基因产物,此时,重复基因就会对这平衡产生影响,从而引发细胞的凋亡。
对活性的影响
在没有立即对适存度产生效果的基因复制,若该基因累积的突变只会使蛋白质转录能力降低而不是完全抑制的话,其仍是可能被保留下来的。在这假说中,分子的功能(像蛋白质或是酵素的活性)在复制后仍会对细胞有最低的效用(最低效能指当只有一个基因座时的效能)。虽然复制基因会使活性降至复制前之下,但是缺少了一段基因却可能产生不利的影响。
复制基因对演化的长期效应
若复制的基因被保留下来,则该段基因最终的命运是会面临随机的突变进而变成一段无功能的基因。像这种仍带有序列同源性的基因残留物,又称为”无用的基因”,有时仍可发现被保留在基因体中。在复制基因间的功能分化则是复制基因另一个可能的走向。
新功能的产生()
新功能这一说最早是由Force et al.于1999年提起[11]。但关于其机制的假说却早在1970年Ohno就提出了。在基因复制长远的影响中,新功能假说说道,一段复制基因仍会维持在复制前的功能,而另一段则获得了另一个完全不一样的功能。这就是我们所知的MDN模型(mutation during non-functionality)。但却有人认为应该是由无功能化(non-functionalization)而来:基因失去功能是因为突变的累积。
Dykhuizen-Hartl Effect(中性过程)
在这假说中,新功能的产生是由于在蛋白质表达区突变的累积所致。这种中性的突变是由基因漂变而来。虽然一开始的基因频率的增加并非由适应而来,但久了以后在生态或生化环境下却也可能会转为因为适应而存在。因此,这可能没有正向选汰参与在其中[12][13]。
IAD假说(适应过程)
IAD代表的是革新(Innovation)、增幅(Amplification)、分化(Divergence),主要在解释当旧基因保有旧功能时,新基因的演化。Innovation,新分子机制的建立,可由任何适合的基因或蛋白质而来。举例来说,虽然酵素通常只会促成一种反应,但有时促成的反应却能超过一种。像这种多样且主流的蛋白质功能若是能带给生物体好处的话,则此基因会被额外的复制。像细菌上带有这种功能且能快速被复制的质体就是最有名的例子,在这质体上的任何基因都会被复制且表达出蛋白质来,并有着各式各样的功能。在许多基因被复制并传给下一代后,其中一些基因会累积复制,并从部分活跃变成主要活跃的基因。
次功能的产生(Subfunctionalization)
次功能化在1999年由Force et al.第一次被提出[11]。这个假说需要一个在复制前就拥有一些不同功能的祖先基因,其后代基因会改变以对其中一些特别的功能做更好的诠释。现在有至少两种模型(DDC和EAC)被归在次功能化中。
DDC假说(中性过程)
DDC假说指的是复制(Duplication)、退化(Degeneration)、互补(Complementation)[11]。这个的第一步为基因复制,复制出来的基因不有利但也不有害,因此在族群的个体中存在的比例较低。根据DDC假说,这时期的中性漂变会导致这两段基因对亚功能产生互补,而这是由会降低活性的突变经过不同世代不段累加所致。这两段突变的基因会一起提供和复制前的祖先基因相同的功能。但,若将其中一段基因移除,功能就无法被完整表达出来,也会对生物产生不利的影响。因此,在这个阶段的晚期这两段基因会面临强烈的择汰压力。最后,这些基因将会永久的被保存在生物体的基因座()中。
EAC假说(适应过程)
EAC假说(Escape from Adaptive Conflict)[14]这个演化过程的提出早于复制基因的发现。一个单独的基因(非复制而来),同时演化出两个有利的功能。因为这两种功能皆无法产生最强的效能,因此称为基因的“适应的冲突”。在这情形下,多功能的基因因而演化出来,并且经过复制后,亚功能被一些特别的后代基因中凸显了出来。这假说的结果与DDC相似,最后会有两个同源但功能皆特化的基因产生。但和DDC假说不同的是,EAC假说将重点着重于基因复制前的多功能时期,并将在复制过后才有益的特化基因作区分。在EAC假说中,正向选汰为推动复制后发展的主要力量,但DDC假说强调的力量是中性的。
参见
参考文献
- ^ Zhang, J.(2003). "Evolution by gene duplication: an update." Trends in Ecology & Evolution 18(6): 292-298. DOI link
- ^ Taylor, JS. & Raes, J.(2004). "Duplication and Divergence: The Evolution of New Genes and Old Ideas" Annual Review of Genetics 9: 615-643. DOI link
- ^ Ohno, S. Evolution by gene duplication. Springer-Verlag. 1970. ISBN 978-0-04-575015-3.
- ^ Hiller LDW et al.(2004). "Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution." Nature 432: 695–716.
- ^ Kellis, M, Birren, BW & Lander, ES.(2004). "Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae" Nature 428: 617-624.
- ^ Chen, Zuozhou; Cheng, C.-H. Christina; Zhang, Junfang; Cao, Lixue; Chen, Lei; Zhou, Longhai; Jin, Yudong; Ye, Hua; Deng, Cheng; Dai, Zhonghua; Xu, Qianghua; Hu, Peng; Sun, Shouhong; Shen, Yu; Chen, Liangbiao. Transcriptomic and genomic evolution under constant cold in Antarctic notothenioid fish. Proceedings of the National Academy of Sciences. 2008-09-02, 105 (35): 12944–12949 [2023-03-12]. doi:10.1073/pnas.0802432105. (原始内容存档于2023-03-12).
- ^ 7.0 7.1 José M. Ranz, John Parsch. Newly evolved genes: moving from comparative genomics to functional studies in model systems. How important is genetic novelty for species adaptation and diversification?. BioEssays. 2012, 34 (6): 477–483 [2013-01-15]. PMID 22461005. doi:10.1002/bies.201100177. (原始内容存档于2019-06-03).
- ^ Kaessmann H. Origins, evolution, and phenotypic impact of new genes.. Genome Res. 2010, 20: 1313–1326.
- ^ Hahn MW, Han MV, Han SG. Gene family evolution across 12 Drosophila genomes.. PLoS Genet. 2007, 3: e197.
- ^ Wu D.D., Irwin D.M., Zhang Y.P. De novo origin of human protein-coding genes.. PLoS Genet. 2011, 7: e1002379.
- ^ 11.0 11.1 11.2 Force, A.; et al. Preservation of duplicate genes by complementary, degenerative mutations. Genetics. 1999, (151): 1531–1545.
- ^ Kimura M. The neutral theory of molecular evolution. Cambridge: Cambridge University Press. 1983.
- ^ Barker, M. S., G. J. Baute, and S.-L. Liu. Plant Genome Diversity. Vienna: Springer. 2012: 155–169.
- ^ Hittinger CT, and Carroll SB. Gene duplication and the adaptive evolution of a classic genetic switch. Nature. 2007, (449): 677–681.