Unicode數字

數字符號(又稱Unicode數字)表示一個數字的字符和字符序列。相同的阿拉伯文數字廣泛用於全球多種書寫系統,它們使用相同的表數語義,但是在不同的書寫系統之間,表示這些數字的字母存在較大差異。為了支持這些字母的差異,Unicode將這些數字編碼包含在許多書寫系統區塊之中。小數在23個獨立的塊中重複:在阿拉伯مرات باللغة العربية中出現2次。六個附加的塊還以富文本形式包含了數字,其主要是作為一個專門的數字使用的字母面板。除了各種阿拉伯語數字外,Unicode還包含了一下不常見的數字,例如:愛琴海數字、羅馬數字、計數杆數字、楔形文字數字和古希臘數字。

數字符號總是會涉及字形的合成,有限數量的字符組合成為其他的數字符號。例如在阿拉伯語數字中9-9-0序列組成了數字九百九十(990)。在羅馬數字中,相同的數字表示為數字符號Ⅹↀ或ⅩⅯ。它們是表示相同抽象數字的不同數字符號。數字符號的語義在其特定的組合中是不同的。阿拉伯語小數是位置-值的組合,而羅馬數字是符號-值的組合併且根據其組合增減。

數字符號的數字屬性

按照在文本使用的數字屬性分組,Unicode有四個數值類型值。首先是「非數字(not a number)」類型。其次是十進制底數數字符號,通常用於西式數字(普通0-9),也可以是非十進制系統的數字,如羅馬數字,和經過排版的十進制數,如環繞數字。

數字類型(Unicode字符屬性)
數字類型 代碼 有數字值 示例 備註
非數字 None
  • A X(拉丁與) α ! [ § À Д μ に 曉 와
數字值="NaN"
十進制數字 De
  • 0 1 9 ६(梵文字母6) ೬(坎那達語6) 𝟨(數學符號,無襯線字體)
直接數字(十進制底數)。對應兩種方式,通用類型=Nd
十進制表意文字 Di
    • ¹(上標) ① ⒈(有句號的數字)
十進制,但經過排版
數字 Nu
    • ¾ ௰(泰米爾語數字十) Ⅹ(羅馬數字符號) 六(漢數字6) 壹(漢語,用於會計時的值1)
數字值,但並非十進制底數

十六進制數

Unicode的十六進制數並非單獨字符,而是使用現有的字母和數字。這些字符的字符屬性標為Hex_digit=Yes,某些字符還標記了ASCII_Hex_digit=Yes。

標記了Hex_Digit=Yes的Unicode字符
0123456789ABCDEF 基本拉丁文、大寫 同時ASCII_Hex_Digit=Yes
0123456789abcdef 基本拉丁文、小寫 同時ASCII_Hex_Digit=Yes
0123456789ABCDEF 全角形式、大寫
0123456789abcdef 全角形式、小寫

不同文字的數字符號

阿拉伯數字

小數

十進制小數

無理數、集合和其他常量的字符

富文本和其他兼容數字符號

中日韓花碼數字符號numerals

Unicode中的花碼數字符號

日語和韓語數字符號

古希臘數字

羅馬數字

算籌

Unicode 5.0 開始,在多文種補充平面中增加了一個區塊用於算籌數字。其包含九個「水平向」數字(U+1D360 到 U+1D368)和九個「垂直向」數字(U+1D369 到 U+1D371),水平向數字用於奇數次冪的位置,而垂直向數字用於偶數次冪的位置。而零則用 U+3007 (〇, ideographic number zero) 來表示,負數符號則使用 U+20E5 (combining reverse solidus overlay)。[1]

算籌數字
Counting Rod Numerals[1][2]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D36x 𝍠 𝍡 𝍢 𝍣 𝍤 𝍥 𝍦 𝍧 𝍨 𝍩 𝍪 𝍫 𝍬 𝍭 𝍮 𝍯
U+1D37x 𝍰 𝍱 𝍲 𝍳 𝍴 𝍵 𝍶 𝍷 𝍸
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未分配的碼位

引用

  1. ^ The Unicode Standard, Version 5.0 – Electronic edition (PDF), Unicode, Inc.: 499–500, 2006 [2013-02-18], (原始內容存檔 (PDF)於2023-08-03)