標記式語言

现代系统文档注释

置標語言(英語:markup language),也稱置標語言標記式語言標誌語言標識語言標示語言,是一種將文本Text)以及文本相關的其他信息結合起來,展現出關於該網頁結構和數據的計算機文字編碼。與文本相關的其他信息(包括例如文本的結構和連結等)與原來的文本結合在一起,但是使用標記(markup)進行標誌。當今廣泛使用的置標語言是超文本置標語言HyperText Markup LanguageHTML)和可擴展置標語言eXtensible Markup LanguageXML)。置標語言廣泛應用於網頁網絡應用程序。標記最早用於出版業,是作者、編輯以及出版商之間用於描述出版作品的排版格式所使用的。

標誌語言的分類

標誌語言通常可以分為三類:表示性的、過程性的以及描述性的。

表示性的標誌語言

表示性的標誌語言(Presentational markup)是在編碼過程中,標記文檔的結構信息。例如,在文本文件中,文件的標題可能需要用特定的格式表示(居中,放大等),這樣我們就需要標記文件的標題。字處理以及桌面出版產品有時候能夠自動推斷出這類的結構信息,但是絕大多數的,像Wiki這樣的純文本編輯器還不能解決這個問題。

過程性標誌

過程性標誌語言(Procedural markup)一般都專門於文字的表達,但通常對於文本編輯者可見,並且能夠被軟件依其出現順序依次解讀。為了格式化一個標題,在標題文本之前,會緊接着插入一系列的格式標誌符,以指示計算機轉換到居中的顯示模式,同時加大及加粗字體。在標題文本之後,會緊接綴上格式中止標誌;對於更高級的系統宏命令或者堆棧模式會讓這一過程的實現方式更加豐富。大多數情況下,過程性標誌能力包含有一個Turing-complete編程語言。過程性標誌語言的範例有:nroff, troff, TeX, Lout以及PostScript。過程性標誌語言被廣泛應用在專業出版領域,專業的出版商會根據要求使用不同的指標語言以達到出版要求。

描述性標誌

描述性標誌(Descriptive Markup)也稱通用標誌,所描述的是文件的內容或結構,而不是文件的顯示外觀或樣式,制定SGML的基本思想就是把文檔的內容與樣式分開,XML、SGML都是典型的通用標誌語言。

歷史

「標誌(markup)」這個詞來源自傳統出版業的「標記」一個手稿,也就是在原稿的邊緣加注一些符號來指示打印上的要求。長久以來,這個工作都是由專門的人("markup men")以及校對人來進行,對原稿標誌出使用什麼樣的字體,字型以及字號,然後再將原稿交給其它人進行手工的排版工作。

GenCode

TeX

TeX是一個由美國電腦教授高德納(Donald E. Knuth)編寫的功能強大的排版軟件。它在學術界十分流行,特別是數學物理學計算機科學界。TeX被普遍認為是一個很好的排版工具,特別是在處理複雜的數學公式時。利用諸如是LaTeX等終端軟件,TeX就能夠排版出精美的文本。

SGML

SGML是一種專門的標記語言,被用作編寫《牛津英語詞典》的電子版本。由於SGML的複雜,導致難以普及。

HTML

超文件標誌語言(英文:HyperText Markup Language,簡稱為HTML)是為網頁創建和其它可在網頁瀏覽器中看到的信息設計的一種標誌語言。

XML

可擴展標誌語言(eXtensible Markup Language,簡稱XML),又稱可擴展標記語言,是一種標誌語言。標誌指計算機所能理解的信息符號,通過此種標記,計算機之間可以處理包含各種信息的文章等。

XHTML

可延伸超文本標誌語言(eXtensible HyperText Markup Language,XHTML),是一種標誌語言,表現方式與超文本標誌語言(HTML)類似,不過語法上更加嚴格。

其它基於XML的應用

還有其它一些基於XML的應用,比如RDFXFormsDocBookSOAP以及Web Ontology Language(OWL)。具體可以參見XML標記語言列表.

特徵

其他應用

  • XAML(Extensible Application Markup Language),基於XML語言,在微軟WPF(Windows Presentation Foundation)中使用。
  • HyTime

參考文獻

外部連結

參見