蛋白质数据库

蛋白质数据库Protein Data Bank,简称PDB)是一个专门收录蛋白质核酸三维结构资料的数据库。由Worldwide Protein Data Bank监管。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。在PDB的基础上,还发展出来若干依据不同原则对PDB结构数据进行分类的数据库,例如GO将PDB中的数据按基因进行了分类。这些资料和数据一般是世界各地的结构生物学家经由X射线晶体学NMR光谱学实验所得,并释放到公有领域供公众免费使用。

蛋白质数据库
内容
相关信息
访问入口
数据格式PDB
网站
工具
其他

历史

PDB的历史可以追溯到1971年,当时布鲁克黑文国家实验室的Walter Hamilton决定在Brookhaven建立这个数据库。1973年Hamilton去世后,Tom Koeztle接管了PDB。1994年1月,以色列魏茨曼科学研究学院的Joel Sussman被任命为PDB负责人。在1998年10月,PDB被移交给了Research Collaboratory for Structural Bioinformatics(RCSB),并与1999年6月移交完毕,新的负责人是罗格斯大学(Rutgers大学)(RCSB成员)的Helen M. Berman。2003年,PDB作为wwPDB的核心,成为了一个国际性组织。同时,wwPDB的其他成员,包括PDBe(欧洲)、RCSB(美国)、PDBj(日本)也为PDB提供了数据积累、处理和发布的中心。BMRB英语Biological Magnetic Resonance Data Bank 于2006年加入[1]。值得一提的是,虽然PDB的数据是由世界各地的科学家提交的,但每条提交的数据都会经过wwPDB工作人员的审核与注解,并检验数据是否合理。PDB及其提供的软件现在对公众免费开放。

内容

 
蛋白质数据库(PDB)中蛋白质结构的一些例子。
 
按方法和年份确定蛋白质结构的速率

PDB数据库每周更新(UTC+0 星期三)。 同样,PDB馆藏列表[2]也每周更新一次。 截至截至2017年3月14日 (2017-03-14),现有统计信息如下:

实验
方法
蛋白质 核酸 蛋白质/核酸
复合物
其他 总数
X射线晶体学 106595 1820 5471 4 113890
核磁共振 10296 1190 241 8 11735
电子显微镜 1021 30 367 0 1418
混合 99 3 2 1 105
其他 181 4 6 13 204
总数: 118192 3047 6087 26 127352
PDB中的103,514个结构具有结构因子文件。
9,057个结构具有NMR约束文件。
PDB中的2,826个结构具有化学位移文件。
PDB中的1,403个结构在EM Data Bank中存有3DEM地图文件

这些数据表明大多数结构是由X射线衍射确定的,但是现在约10%的结构由蛋白质NMR确定。 当使用X射线衍射时,获得蛋白质原子坐标的近似值,而通过NMR实验发现蛋白质原子对之间距离的估计值。 因此,在后一种情况下,通过求解距离几何问题英语Distance geometry problem来获得蛋白质的最终构象。 一些蛋白质由低温电子显微镜确定。 (单击原始表中的数字将显示由该方法确定的结构示例。)

上述结构因子文件的意义在于,对于具有结构文件的由X射线衍射确定的PDB结构,可以查看电子密度图。 这些结构的数据存储在“电子密度服务器”上[3][4]

过去,PDB的结构数量以近似指数的速度增长,通过了1982年的100个注册结构里程碑,1993年的1,000个,1999年的10,000个,以及2014年的100,000个[5][6]。然而,自2007年以来,新蛋白质结构的积累速率似乎已经趋于稳定。

以下为PDB成员网站

参见

参考文献

  1. ^ BMRB - Biological Magnetic Resonance Bank. [2014-01-02]. (原始内容存档于2020-10-20). 
  2. ^ PDB Current Holdings Breakdown. RCSB. [2018-04-22]. (原始内容存档于2007-07-04). 
  3. ^ The Uppsala Electron Density Server. Uppsala University. [2013-04-06]. (原始内容存档于2021-03-21). 
  4. ^ Kleywegt GJ, Harris MR, Zou JY, Taylor TC, Wählby A, Jones TA. The Uppsala Electron-Density Server. Acta Crystallogr D. Dec 2004, 60 (Pt 12 Pt 1): 2240–2249. PMID 15572777. doi:10.1107/S0907444904013253. 
  5. ^ Anon. Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures. Nature. 2014, 509 (7500): 260. PMID 24834514. doi:10.1038/509260a. 
  6. ^ Content Growth Report. RCSB PDB. [2013-04-06]. (原始内容存档于2007-04-28). 

外部链接