私人使用區

Unicode中,私人使用區(英語:Private Use Areas,PUA)指其解釋未在Unicode標準中指定,而是由合作用戶之間的私人協議決定其用途的一系列碼位。[4] 目前定義了三個私人使用區:一個在基本多語言平面(U+E000-U+F8FF)中,另外兩個幾乎包含了整個第15和第16平面(分別為U+F0000-U+FFFFD,U+100000-U+10FFFD)。[5]

私人使用區
Private Use Area
範圍U+E000..U+F8FF
(6,400個碼位)
平面基本多文種平面BMP
文字
已分配6,400個碼位
未分配0個保留碼位
統一碼版本歷史
1.0.05,632 (+5,632)
1.0.16,400 (+768)
註釋:Unicode 1.0.1 版移動並擴展了私人使用區。 (1.0.0 版中曾位於 U+E800-U+FDFF。)[1][2][3]
補充私人使用區-A
範圍U+F0000..U+FFFFD
(65,534個碼位)
平面私人使用區-A
文字未知
已分配65,534個碼位
未分配−2個保留碼位
2個非字元
統一碼版本歷史
2.065,534 (+65,534)
註釋[2][3]
補充私人使用區-B
範圍U+100000..U+10FFFD
(65,534個碼位)
平面私人使用區-B
文字未知
已分配65,534個碼位
未分配−2個保留碼位
2個非字元
統一碼版本歷史
2.065,534 (+65,534)
註釋[2][3]

私人使用區字符的分配,可以不由字面意義上的「私人」決定。一些組織已經發布了一些分配計劃。但根據其定義,私人使用區相同的代碼點可分配為不同的字符,因此使用某種字體的用戶看到其顯示為一種形態,但使用其它字體的用戶看到的字符可能完全不同。

使用實例

  • 中國國家標準 GB/T 20542-2006(「藏文編碼字符集擴展A」)和 GB/T 22238-2008(「藏文編碼字符集擴展B」)使用私人使用區存放藏文連字。
  • GB 18030GBK使用私人使用區臨時編碼Unicode標準之外的字符。
  • 愛沙尼亞語言研究院使用私人使用區編碼Unicode標準未收錄的拉丁字母和西里爾字母。[6]
  • 機讀編目格式標準MARC 21使用私人使用區編碼未被Unicode收錄的東亞字符。
  • 美國國際語言暑期學院使用私人使用區編碼Unicode標準未收錄的語言中的字符。

分配

Unicode 私人使用區
按字符屬性定義: General Category=Co[a][b]
範圍 平面 區塊名 碼位總數 注釋
U+E000..U+F8FF 基本多語言平面 私人使用區
Private Use Area
6,400
U+F0000..U+FFFFD[c] 第15平面[d] 補充私人使用區-A
Supplementary Private Use Area-A
65,534 UTF-16使用在基本多文種平面中的高半私人代用區(U+DB80..U+DBFF)編碼這些字符。
U+100000..U+10FFFD[c] 第16平面[d] 補充私人使用區-B
Supplementary Private Use Area-B
65,534
注釋
  1. ^ Unicode 10.0 Data
  2. ^ The Unicode Standard, Section 23.5: Private-Use Characters
  3. ^ 碼位 U+FFFFE, U+FFFFF, U+10FFFE, U+10FFFF 是 非字符 ,而非私人使用區字符。
  4. ^ Unicode 未公布第15平面與第16平面的識別名。根據 Chapter 2.8 ,補充私人使用區-A與補充私人使用區-B是兩個私人使用區區塊的名字,而非平面的名字。

參見

Unicode輔助平面一覽表
基本平面 · 第一輔助平面 · 第二輔助平面 · 第三輔助平面 · · 第十四輔助平面 · 第十五輔助平面 · 第十六輔助平面

參考

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2022-07-09]. (原始內容 (PDF)存檔於2022-07-02). 
  2. ^ 2.0 2.1 2.2 Unicode character database. The Unicode Standard. [2022-07-09]. (原始內容存檔於2016-03-12). 
  3. ^ 3.0 3.1 3.2 Enumerated Versions of The Unicode Standard. The Unicode Standard. [2021-07-09]. (原始內容存檔於2022-12-25). 
  4. ^ Unicode Consortium. Glossary of Unicode Terms: "Private Use Area (PUA)"頁面存檔備份,存於網際網路檔案館
  5. ^ Chapter 16: Special Areas and Format Characters (PDF). The Unicode Standard. Unicode Consortium. [2021-03-19]. (原始內容 (PDF)存檔於2022-01-17). 
  6. ^ Letter Database. Eki.ee. [2013-04-11]. (原始內容存檔於2018-05-21).