系統生物學標記語言
系統生物學標記語言(英語:Systems Biology Markup Language,簡稱SBML)是機器可讀的、基於XML的置標語言,用於描述生化反應等網絡的計算模型。SBML可以描述代謝網絡、細胞信號通路、調節網絡、以及在系統生物學研究範疇中的其它系統。
歷史
2000年,在日本科學技術振興機構(JST) (頁面存檔備份,存於網際網路檔案館)的資助下,Hiroaki Kitano和John C. Doyle發起組建了一個研究小組試圖為系統生物學的計算模型發展更佳的基礎性軟體。Hamid Bolouri是這個小組的組長,其成員有Andrew Finney、Herbert Sauro以及Michael Hucka。他們最初的工作集中於設計一個使現有的生物學模擬軟體包中的一部分可以互相交換數據的系統。這些軟體包括Berkeley BioSpice (頁面存檔備份,存於網際網路檔案館), DBSolve, E-Cell (頁面存檔備份,存於網際網路檔案館), Gepasi[永久失效連結], Jarnac (頁面存檔備份,存於網際網路檔案館), StochSim和The Virtual Cell (頁面存檔備份,存於網際網路檔案館)。從那時起,越來越多的軟體開始支持SBML。
編寫這些軟體工具的若干工作小組於2000年4月28到29日參加了在加州理工學院(California Institute of Technology)舉行的ERATO分子生物學軟體平台會議。他們取得了一個共識,即為了更好地交換信息,所有的組件必須以相同的格式來進行對模型的描述。會議決定採用XML作為描述模型的編碼語言,因為這時XML語言因可能被採用為網際網路數據標準而得到了人們的注意。
緊接著,Kitano小組為作為體系組成部分的軟體Systems Biology Workbench (SBW) (頁面存檔備份,存於網際網路檔案館)和作為模型描述格式的SBML語言制定了最初的規範和方案。
本語言
目的
SBML有如下三個主要的目的:
- 使得軟體工具之間可以通用而不必重寫模型;
- 使得模型用一種統一的格式發布和共享,這樣其他研究者們可以在不同的軟體環境中打開模型;
- 確保模型被某個軟體創建之後在該軟體的整個生命周期中都可用。
SBML並非是為了描述定量模型而定義的通用語言。它的目的是設計成一種「混合通用語言」,也就是說作為現有軟體工具間交換計算模型的基本數據的交換格式。
主要功能
SBML可以編碼由生化分子及其相互反應而成的生化反應網絡組成的模型。一個重要的原則是,該模型可被分解成明確標記的組成元素,而且元素的集合可比擬成對反應方程式的一種精細的再現;而這種再現並非直接將模型映射為一組(微分)反應方程式的集合或其它對模型的精細解釋。這種分解在元素組成上是明確的而在大體模型框架上是模糊的,這種特性使得軟體工具易於進行對模型的解釋,並把SBML格式轉換成任意的、在軟體內部實際使用的格式。
支持SBML的軟體包應該能讀出使用SBML的模型描述文件,並將它轉換成軟體的內部格式以進行對模型的分析。例如,某個軟體包可能提供通過構造反應網絡中的(微分)方程式來進行模型仿真的功能,進而可對方程式進行數值的時程積分(numerical time integration),以進行對模型動力學特性的研究。又如另一種情況,某個軟體包可能會構造一種離散的隨機模型,並使用動態的[蒙特卡洛法]進行對模型的仿真(如[Gillespie算法])。
SBML能夠描述任意複雜度的模型。模型中的每種組件用特定的能夠良好組織該組件相關信息的資料結構來描述。這些資料結構決定了整個模型如何用[XML]編碼。
級別和版本
SBML被定義為不同級別。並支持級別的向下兼容。一般說來,級別越高,功能越多,表達能力也越強。如果一個軟體能夠翻譯高級別的SBML,那麼它也能夠翻譯低級別的SBML。反之,卻不是這樣。 高的級別的SBML只代表更多的功能和更強的表達能力,並不取代低的級別。但在同一級別內,新的版本取代舊版本。
- Level 1 Version 2 (頁面存檔備份,存於網際網路檔案館) (SBML L1V2)
- Level 2 Version 3 (頁面存檔備份,存於網際網路檔案館) (SBML L2V3)
開源軟體,例如libSBML (頁面存檔備份,存於網際網路檔案館)支持級別1和級別2,儘可能為用戶提供最大方便。
發布於2007年6月16日的L2V3是最新的SBML版本。
結構
相關團體
參考文獻
- Hucka M, Finney A, Sauro HM, Bolouri H, Doyle JC, Kitano H, Arkin AP, Bornstein BJ, Bray D, Cornish-Bowden A, Cuellar AA, Dronov S, Gilles ED, Ginkel M, Gor V, Goryanin II, Hedley WJ, Hodgman TC, Hofmeyr JH, Hunter PJ, Juty NS, Kasberger JL, Kremling A, Kummer U, Le Novere N, Loew LM, Lucio D, Mendes P, Minch E, Mjolsness ED, Nakayama Y, Nelson MR, Nielsen PF, Sakurada T, Schaff JC, Shapiro BE, Shimizu TS, Spence HD, Stelling J, Takahashi K, Tomita M, Wagner J, Wang J. "The systems biology markup language (SBML): a medium for representation and exchange of biochemical network models." Bioinformatics. 2003 19: 524-531.
- Finney A, Hucka M. "Systems biology markup language: Level 2 and beyond." Biochem Soc. Trans. 2003 31: 1472-1473.
- Hucka M, Finney A, Bornstein BJ, Keating SM, Shapiro BE, Matthews J, Kovitz BL, Schilstra MJ, Funahashi A, Doyle JC, and Kitano H, 「Evolving a Lingua Franca and Associated Software Infrastructure for Computational Systems Biology: The Systems Biology Markup Language (SBML) Project」, Systems Biology 1:41-53 (2004).
- Finney A, Hucka M, Bornstein BJ, Keating SM, Shapiro BE, Matthews J, Kovitz BL, Schilstra MJ, Funahashi A, Doyle JC, Kitano H, Software Infrastructure for Effective Communication and Reuse of Computational Models. In System Modeling in Cellular Biology: From Concepts to Nuts and Bolts, ed. Szallasi Z, Stelling J, Periwal V, MIT Press, 2006.
參見
外部連結
- http://sbml.org (頁面存檔備份,存於網際網路檔案館) SBML的官方主頁。