Unicode字型

Unicode字型(或稱 UCS字體Unicode字體)指的是字符字母數字符號字形等)收錄範圍較為廣泛的電腦字型。這些字符都被集入通用字符集(UCS),來自全世界的各種語言書寫系統。不像大部分傳統的電腦字型,Unicode字型並不局限於某幾種語言或某種老舊字符集,收錄的字符數也遠超傳統字體中UCS小子集的數量。Unicode字型嘗試收錄幾千種可能的字形,以便可在多種語言的文稿中單獨使用。

背景

Unicode標準本身並不指定或者創造任何字體(typeface),也即字形的集合。這個標準定義的是作為抽象數字(碼點)的字符[1],以及在不同上下文中這些字符應如何變形(如組合字符預組字符字母附加符號等)。至於這些字符怎麼以位圖向量圖格式輸出以便查看,也就是對於字型的選擇,則留給用戶決定。如果選定的字體不含有這個碼點指定的字符,一般來說會顯示一個問號、一個方框,或是別的替換字符

電腦字型使用各種技術來顯示字符或字形。點陣字體包含稱為像素的點網格,形成每個面和大小的每個字形的圖像。輪廓字體(也稱為向量字體)使用繪圖指令或數學公式來描述每個字形。筆畫字體使用一系列指定的線條(用於字形的邊框)和附加信息來定義輪廓,或特定面和尺寸中線條的大小和形狀,它們一起描述字形的外觀。

字體還包括嵌入的特殊拼寫規則,以輸出某些字母形式(同一字母的替代符號)組合成特殊的連字形式(混合字符)。作業系統、Web 瀏覽器(用戶代理)和其他廣泛使用排版的軟件使用字體在屏幕或打印媒體上顯示文本,並且可以通過編程來使用這些嵌入規則。或者,它們可以使用外部腳本整形技術(渲染技術或「智能字體」引擎),它們也可以被編程為使用大的 Unicode 字體,或者為不同的字符或語言使用多種不同的字體。

沒有單一的「Unicode 字體」包含 ISO 10646 (Unicode) 標準當前修訂版中定義的所有字符,因為越來越多的語言和字符不斷添加到其中,並且常見字體格式不能包含超過 65,535 個字形(大約一半) Unicode 編碼的字符數)。因此,字體開發商和代工廠將新字符合併到字體的較新版本或修訂版中,或專門用於特定語言的單獨輔助字體中。

通用編碼字符集擁有超過 110 萬個代碼點,但只有前 65,536 個在 2000 年之前投入使用。

第一個 Unicode 字體(具有非常大的字符集,並支持許多 Unicode區段)是 Lucida Sans Unicode(1993 年 3 月發佈)、Unihan 字體(1993 年)和 Everson Mono(1995 年)。

問題

Unicode 中存在排版上的歧義,因此某些統一的漢字(在中文、日文和韓文中可見)在不同地區的排版上會有所不同。 例如,U+9AA8 在簡體中文和繁體中文之間在排版上是不同的。 這對單一字體可以滿足所有地區需求的想法有影響。[2] Unicode 的設計確保這種差異不會造成語義歧義,但不正確的形式的使用通常被認為是東亞語言的母語讀者視覺上的尷尬或審美上的不合適。

Unicode 字體的應用

Unicode 現在是許多新標準和協議的標準編碼,並內置於作業系統(Microsoft Windows、Apple Mac OS 以及許多版本的 Unix 和 Linux)、程式語言(Ada、Perl、Python、Java、 Common LISP、APL)和庫(IBM International Components for Unicode (ICU),以及 Pango、Graphite、Scribe、Uniscribe 和 ATSUI 渲染引擎)、字體格式(TrueType 和 OpenType)等。 許多其他標準也正在升級以符合 Unicode。

實用軟件

以下是一些可以識別字體文件中存在的字符的實用軟件的選擇:

  • 字符映射,Microsoft Windows 附帶的小程序
  • Font Book,Mac OS 附帶的應用程式
  • GNOME 字符映射表,包含在 GNOME 桌面環境中的應用程式
  • BabelMap,適用於 Windows 的第三方軟件

Unicode 字體列表

在眾多可用的 Unicode 字體中,下面列出的字體是全球主流計算平台上最常用的字體。

參考

  1. ^ 字體和鍵盤. 統一碼聯盟. 2017-06-28 [2021-12-23]. (原始內容存檔於2019-10-18). 
  2. ^ 小林劍,《中日韓文信息處理》, 歐萊禮媒體, 1999. 第 128 頁,《中日韓文 字形差異》