中日韓符號和標點

中日韓符號和標點是一個位於基本多文種平面的Unicode區塊,包含了用於漢語、日語和韓語的符號和標點。本區塊雖然名為「符號和標點」,但也包含了一個漢字「〇」(U+3007)。

中日韓符號和標點
CJK Symbols and Punctuation
範圍U+3000..U+303F
(64個碼位)
平面基本多文種平面BMP
文字漢字(15個)
諺文(2個)
通用(43個)
繼承(4個)
已分配64個碼位
未分配0個保留碼位
統一碼版本歷史
1.0.056 (+56)
1.0.156 (+0)
1.157 (+1)
3.061 (+4)
3.264 (+3)
註釋[1][2][3]

區塊

中日韓符號和標點
CJK Symbols and Punctuation
[1]
Unicode 聯盟官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+300x ID
 SP 
U+301x
U+302x
U+303x  〾 
Notes
1.^ 依據 Unicode 13.0

變體選擇符

本區段包含部分標點位置的變體選擇符[4][5] 其中使用了 U+FE00 VARIATION SELECTOR-1 (VS01) 及 U+FE01 VARIATION SELECTOR-2 (VS02):

標點符號位置變體
U+3001 U+3002 位置
基本字符
基本字符 + VS01 、︀ 。︀ 左下角
基本字符 + VS02 、︁ 。︁ 置中

漢字「〇」

〇是漢字,本應與其他漢字一樣置於漢字區,但卻被置於本區塊,碼位為U+3007。這一做法導致檢索〇字時連帶檢索出數字0,使用上極為不便。許多程序把漢字區外的字符都認為不是漢字,這會導致程序無法處理〇字。

繪文字

本區塊含有2個繪文字:U+3030 和 U+303D。[6][7]

此區塊有4個標準化變體,為2個基本字符指定顯示樣式:採用U+FE0F VARIATION SELECTOR-16(VS16)以繪文字顯示,或採用U+FE0E VARIATION SELECTOR-15(VS15)以文本顯示,基本字符默認為文本顯示。[8]

繪文字標準化變體
U+3030 U+303D
基本字符
基本字符 + VS15文本 〰︎ 〽︎
基本字符 + VS16繪文字 〰️ 〽️

歷史

U+3004於Unicode 1.0是形狀類似「仝」的日本「同上符號」;於Unicode 1.0.1為了兼容ISO 10646,與中日韓統一表意文字 U+4EDD 的「仝」字合併了,並由原位於 U+32FF(中日韓圍繞字元及月份)的日本工業標準(〄)標誌取代[9]

以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程:

參考文獻

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始內容存檔 (PDF)於2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始內容存檔於2018-12-25). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始內容存檔於2018-12-25). 
  4. ^ Lunde, Ken. L2/17-436: Proposal to add standardized variation sequences for fullwidth East Asian punctuation (PDF). 2018-01-21 [2021-02-24]. (原始內容存檔 (PDF)於2020-01-31). 
  5. ^ Unicode Character Database: Standardized Variation Sequences. The Unicode Consortium. [2021-02-24]. (原始內容存檔於2021-02-09). 
  6. ^ UTR #51: Unicode Emoji. Unicode Consortium. 2017-05-18 [2018-03-20]. (原始內容存檔於2019-05-01). 
  7. ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2017-03-27 [2018-03-20]. (原始內容存檔於2020-04-16). 
  8. ^ UTS #51 Emoji Variation Sequences. The Unicode Consortium. [永久失效連結]
  9. ^ 存档副本 (PDF). [2019-03-22]. (原始內容存檔 (PDF)於2016-07-02).