Unicode數字
數字符號(又稱Unicode數字)表示一個數字的字符和字符序列。相同的阿拉伯文數字廣泛用於全球多種書寫系統,它們使用相同的表數語義,但是在不同的書寫系統之間,表示這些數字的字母存在較大差異。為了支持這些字母的差異,Unicode將這些數字編碼包含在許多書寫系統區塊之中。小數在23個獨立的塊中重複:在阿拉伯مرات باللغة العربية中出現2次。六個附加的塊還以富文本形式包含了數字,其主要是作為一個專門的數字使用的字母面板。除了各種阿拉伯語數字外,Unicode還包含了一下不常見的數字,例如:愛琴海數字、羅馬數字、計數杆數字、楔形文字數字和古希臘數字。
數字符號總是會涉及字形的合成,有限數量的字符組合成為其他的數字符號。例如在阿拉伯語數字中9-9-0序列組成了數字九百九十(990)。在羅馬數字中,相同的數字表示為數字符號Ⅹↀ或ⅩⅯ。它們是表示相同抽象數字的不同數字符號。數字符號的語義在其特定的組合中是不同的。阿拉伯語小數是位置-值的組合,而羅馬數字是符號-值的組合併且根據其組合增減。
數字符號的數字屬性
按照在文本使用的數字屬性分組,Unicode有四個數值類型值。首先是「非數字(not a number)」類型。其次是十進制底數數字符號,通常用於西式數字(普通0-9),也可以是非十進制系統的數字,如羅馬數字,和經過排版的十進制數,如環繞數字。
數字類型(Unicode字符屬性) | ||||
---|---|---|---|---|
數字類型 | 代碼 | 有數字值 | 示例 | 備註 |
非數字 | None |
否 |
|
數字值="NaN" |
十進制數字 | De |
是 |
|
直接數字(十進制底數)。對應兩種方式,通用類型=Nd |
十進制表意文字 | Di |
是 |
|
十進制,但經過排版 |
數字 | Nu |
是 |
|
數字值,但並非十進制底數 |
十六進制數
Unicode的十六進制數並非單獨字符,而是使用現有的字母和數字。這些字符的字符屬性標為Hex_digit=Yes,某些字符還標記了ASCII_Hex_digit=Yes。
標記了Hex_Digit=Yes的Unicode字符 | ||
---|---|---|
0123456789ABCDEF | 基本拉丁文、大寫 | 同時ASCII_Hex_Digit=Yes |
0123456789abcdef | 基本拉丁文、小寫 | 同時ASCII_Hex_Digit=Yes |
0123456789ABCDEF | 全角形式、大寫 | |
0123456789abcdef | 全角形式、小寫 |
不同文字的數字符號
此章節需要擴充。 (2014年8月15日) |
阿拉伯數字
小數
十進制小數
無理數、集合和其他常量的字符
富文本和其他兼容數字符號
中日韓花碼數字符號numerals
Unicode中的花碼數字符號
日語和韓語數字符號
古希臘數字
羅馬數字
算籌
Unicode 5.0 開始,在多文種補充平面中增加了一個區塊用於算籌數字。其包含九個「水平向」數字(U+1D360 到 U+1D368)和九個「垂直向」數字(U+1D369 到 U+1D371),水平向數字用於奇數次冪的位置,而垂直向數字用於偶數次冪的位置。而零則用 U+3007 (〇, ideographic number zero) 來表示,負數符號則使用 U+20E5 (combining reverse solidus overlay)。[1]
算籌數字 Counting Rod Numerals[1][2] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1D36x | 𝍠 | 𝍡 | 𝍢 | 𝍣 | 𝍤 | 𝍥 | 𝍦 | 𝍧 | 𝍨 | 𝍩 | 𝍪 | 𝍫 | 𝍬 | 𝍭 | 𝍮 | 𝍯 |
U+1D37x | 𝍰 | 𝍱 | 𝍲 | 𝍳 | 𝍴 | 𝍵 | 𝍶 | 𝍷 | 𝍸 | |||||||
註釋 |
引用
- ^ The Unicode Standard, Version 5.0 – Electronic edition (PDF), Unicode, Inc.: 499–500, 2006 [2013-02-18], (原始內容存檔 (PDF)於2023-08-03)