蛋白质组
蛋白质组(也称蛋白质体,proteome),是在特定时间内一个由基因组、细胞、组织、或生物体表达的整套蛋白质。 它是在给定时间,在给定条件下在给定类型的细胞或生物中表达的蛋白质的集合。 研究蛋白质组的学科就是蛋白质组学。
系统
该术语已应用于几种不同类型的生物系统。
细胞蛋白质组是在特定环境条件下(例如暴露于激素刺激下)在特定细胞类型中发现的蛋白质的集合。
考虑生物体的完整蛋白质组也很有用,可以将其概念化为来自所有各种细胞蛋白质组的蛋白质的完整集合。 这非常近似于基因组的蛋白质等效物。
术语“蛋白质组”也已用于表示某些亚细胞生物系统中蛋白质的收集。 例如,病毒中的所有蛋白质都可以称为病毒蛋白质组。 线粒体中的所有蛋白质组成了线粒体蛋白质组[1],从而产生了自己的研究领域。
历史
该词最早由马克·威尔金斯(Marc Wilkins)和基思·威廉姆斯(Keith Williams)于1994年在意大利锡耶纳举行的“二维电泳:从蛋白质图谱到基因组”研讨会提出,并于1995年7月在期刊《电泳》(Electrophoresis)上发表[2][3]。威尔金斯(Wilkins)使用该术语来描述由一个基因组,细胞,组织,或生物体表达的蛋白质的全体。
在癌症中的重要性
可以使用蛋白质组来比较分析不同的癌细胞系。 蛋白质组研究已被用于鉴定膀胱癌细胞株KK47和YTS1中转移的可能性,并发现其含有36种未调控的蛋白质和74种下调的蛋白质[4]。 蛋白质表达的差异可以帮助鉴定新的癌症信号传导机制。
已经通过基于质谱法的蛋白质组分析发现了癌症的生物标志物(Biomarker)。 蛋白质组学的使用或蛋白质组的研究是个性化医学(personalized medicine)的一大进步,可以根据患者特定的蛋白质组学和基因组特征定制药物混合物[5]。
大小和内容
蛋白质组的体量大于基因组,这种差距在真核生物中表现得更为明显。因为很多mRNA在转录完成以后,会经历RNA剪接(RNA splicing)的阶段。同一条mRNA经由不同的方式的剪接,会形成不同的成熟RNA产物(即剪切变体,splice variant)[6]。此外,大部分蛋白质在翻译阶段结束后,会经历翻译后修饰(蛋白质特定残基被修饰,如磷酸化、糖基化等)。例如,截至2014年,在人类蛋白质组中共发现92179种蛋白质,其中71173个是剪接变体[7]。另一方面,并不是所有的基因最终都会生成蛋白质,许多已知的基因编码的最终产物是RNA。此外,完整的蛋白质组大小取决于生物所处的界。 例如,2016年发布的一项研究显示,真核生物,细菌,古菌,和病毒平均在其基因组中分别编码有15145、3200、2358和42种蛋白质[8]。
血浆蛋白质组数据库(Plasma Proteome database) (页面存档备份,存于互联网档案馆)包含有关10,500种血浆蛋白质的信息。 由于血浆中蛋白质含量的范围非常大,因此与含量丰富的蛋白质相比,很难检测到往往含量稀缺的蛋白质。 有一个分析极限,可能是检测超低浓度蛋白质的障碍[9]。
当前,有一个名为“人类蛋白质组图(Human Proteome Map) (页面存档备份,存于互联网档案馆)”的项目。 与人类基因组计划非常相似,人类蛋白质组图试图将所有蛋白质测序数据发布到一个数据库中。 目前,该数据库具有由17,000多种人类基因编码的蛋白质。 该数据库包含来自不同胎儿和成人组织以及不同类型造血细胞的蛋白质组学分析。 此外,数据库neXtprot和UniProt (页面存档备份,存于互联网档案馆)包含人类蛋白质组数据和分析特定特征的方法。
蛋白质组研究方法
分析蛋白质比分析核酸序列更加困难。 虽然只有4个核苷酸组成DNA,但至少有20个不同的氨基酸可以组成蛋白质。 另外,目前还没有已知的高通量技术来复制单个蛋白质。 研究蛋白质,蛋白质组,或整个蛋白质组的方法很多。 实际上,蛋白质经常被间接地研究,例如,使用计算方法和基因组分析蛋白质。 以下仅举几个例子。
分离技术和电泳
和蛋白质组有关的研究,称作蛋白质组学,最常用在从粹取物中分离蛋白质的方法是二维电泳(2-D Electrophoresis),二维电泳的第一维过程中,蛋白质依其等电点的不同被分离开来,第二维的过程是用十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)将蛋白质依分子量的不同加以分离,电泳结束后可将胶片以银染或考马斯亮蓝染色法的方式染色,让蛋白质显现出来。凝胶上的斑点是已经迁移到特定位置的蛋白质。
质谱法
质谱法是研究蛋白质组的关键方法之一[10]。 一些重要的质谱方法包括LTQ轨道阱质谱,MALDI(基质辅助激光解吸/电离)和ESI(电喷雾电离)。
色谱法
液相色谱法是蛋白质组研究中的重要工具。它可以根据它们对基质的亲和力非常敏感地分离不同种类的蛋白质。
墨点法
西方墨点法可以被使用来定量某些蛋白质的丰度。 通过使用对目标蛋白质具有特异性的抗体,可以从蛋白质混合物中探测特定蛋白质的存在。
蛋白质数据库
人类蛋白质图谱(Human Protein Atlas) (页面存档备份,存于互联网档案馆))包含有关细胞、组织和器官中人类蛋白质的信息。 知识资源中的所有数据都是开放获取的,允许学术界和工业界的科学家自由获取数据以探索人类蛋白质组。 ELIXIR (页面存档备份,存于互联网档案馆)组织选择蛋白质图谱作为核心资源,因为它对于更广泛的生命科学界至关重要。
血浆蛋白质组数据库(Plasma Proteome database) (页面存档备份,存于互联网档案馆)包含 10,500 种血浆蛋白质的信息。 由于血浆中蛋白质含量的范围非常大,因此很难检测到与丰富的蛋白质相比往往稀缺的蛋白质。 这是一个分析极限,可能会成为检测超低浓度蛋白质的障碍[9]。
参见
参考文献
- ^ Gómez-Serrano, M. Mitoproteomics: Tackling Mitochondrial Dysfunction in Human Disease.. Oxid Med Cell Longev. November 2018, 2018: 1435934. PMC 6250043 . PMID 30533169. doi:10.1155/2018/1435934.
- ^ 蛋白质组学研究进展与应用-科研前沿-中国水稻信息网. (原始内容存档于2019-12-06).
- ^ Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium.. (原始内容存档于2020-04-07).
- ^ Yang, Ganglong; Xu, Zhipeng; Lu, Wei; Li, Xiang; Sun, Chengwen; Guo, Jia; Xue, Peng; Guan, Feng. Quantitative Analysis of Differential Proteome Expression in Bladder Cancer vs. Normal Bladder Cells Using SILAC Method. PLOS One. 2015-07-31, 10 (7): e0134727. Bibcode:2015PLoSO..1034727Y. ISSN 1932-6203. PMC 4521931 . PMID 26230496. doi:10.1371/journal.pone.0134727.
- ^ An, Yao; Zhou, Li; Huang, Zhao; Nice, Edouard C.; Zhang, Haiyuan; Huang, Canhua. Molecular insights into cancer drug resistance from a proteomics perspective. Expert Review of Proteomics. 2019-05-04, 16 (5): 413–429. ISSN 1478-9450. PMID 30925852. doi:10.1080/14789450.2019.1601561.
- ^ The Size of the Human Proteome: The Width and Depth. (原始内容存档于2021-05-14).
- ^ UniProt: a hub for protein information. Nucleic Acids Research. 2014, 43 (D1): D204–D212. ISSN 0305-1048. PMC 4384041 . PMID 25348405. doi:10.1093/nar/gku989.
- ^ Kozlowski, LP. Proteome-pI: proteome isoelectric point database.. Nucleic Acids Research. 26 October 2016: gkw978. PMID 27789699. doi:10.1093/nar/gkw978.
- ^ 9.0 9.1 Ponomarenko, Elena A.; Poverennaya, Ekaterina V.; Ilgisonis, Ekaterina V.; Pyatnitskiy, Mikhail A.; Kopylov, Arthur T.; Zgoda, Victor G.; Lisitsa, Andrey V.; Archakov, Alexander I. The Size of the Human Proteome: The Width and Depth. International Journal of Analytical Chemistry. 2016, 2016: 7436849. ISSN 1687-8760. PMC 4889822 . PMID 27298622. doi:10.1155/2016/7436849.
- ^ Altelaar, AF; Munoz, J; Heck, AJ. Next-generation proteomics: towards an integrative view of proteome dynamics.. Nature Reviews Genetics. January 2013, 14 (1): 35–48. PMID 23207911. doi:10.1038/nrg3356.
外部链接
- (英文)PIR database
- (英文)UniProt database (页面存档备份,存于互联网档案馆)
- (英文)Pfam database,存档于美国国会图书馆(存档日期 2011-05-06)