中日韩符号和标点

中日韩符号和标点是一个位于基本多文种平面的Unicode区块,包含了用于汉语、日语和韩语的符号和标点。本区块雖然名為“符號和標點”,但也包含了一個漢字“〇”(U+3007)。

中日韩符号和标点
CJK Symbols and Punctuation
範圍U+3000..U+303F
(64個碼位)
平面基本多文種平面BMP
文字汉字(15個)
谚文(2個)
通用(43個)
继承(4個)
已分配64個碼位
未分配0個保留碼位
統一碼版本歷史
1.0.056 (+56)
1.0.156 (+0)
1.157 (+1)
3.061 (+4)
3.264 (+3)
註釋[1][2][3]

区块

中日韩符号和标点
CJK Symbols and Punctuation
[1]
Unicode 联盟官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+300x ID
 SP 
U+301x
U+302x
U+303x  〾 
Notes
1.^ 依據 Unicode 13.0

变体选择符

本区段包含部分标点位置的变体选择符[4][5] 其中使用了 U+FE00 VARIATION SELECTOR-1 (VS01) 及 U+FE01 VARIATION SELECTOR-2 (VS02):

标点符号位置变体
U+3001 U+3002 位置
基本字符
基本字符 + VS01 、︀ 。︀ 左下角
基本字符 + VS02 、︁ 。︁ 置中

漢字“〇”

〇是漢字,本應與其他漢字一樣置於漢字區,但卻被置於本區塊,碼位為U+3007。這一做法導致檢索〇字時連帶檢索出數字0,使用上極為不便。許多程序把漢字區外的字符都認為不是漢字,這會導致程序無法處理〇字。

绘文字

本區塊含有2个绘文字:U+3030 和 U+303D。[6][7]

此區塊有4個标准化變體,为2個基本字符指定显示樣式:採用U+FE0F VARIATION SELECTOR-16(VS16)以绘文字显示,或採用U+FE0E VARIATION SELECTOR-15(VS15)以文本显示,基本字符默認為文本顯示。[8]

绘文字標準化變體
U+3030 U+303D
基本字符
基本字符 + VS15文本 〰︎ 〽︎
基本字符 + VS16绘文字 〰️ 〽️

历史

U+3004於Unicode 1.0是形狀類似「仝」的日本「同上符號」;於Unicode 1.0.1為了兼容ISO 10646,與中日韓統一表意文字 U+4EDD 的「仝」字合併了,並由原位於 U+32FF(中日韓圍繞字元及月份)的日本工業標準(〄)標誌取代[9]

以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程:

參考文獻

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始内容存档 (PDF)于2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2018-12-25). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2018-12-25). 
  4. ^ Lunde, Ken. L2/17-436: Proposal to add standardized variation sequences for fullwidth East Asian punctuation (PDF). 2018-01-21 [2021-02-24]. (原始内容存档 (PDF)于2020-01-31). 
  5. ^ Unicode Character Database: Standardized Variation Sequences. The Unicode Consortium. [2021-02-24]. (原始内容存档于2021-02-09). 
  6. ^ UTR #51: Unicode Emoji. Unicode Consortium. 2017-05-18 [2018-03-20]. (原始内容存档于2019-05-01). 
  7. ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2017-03-27 [2018-03-20]. (原始内容存档于2020-04-16). 
  8. ^ UTS #51 Emoji Variation Sequences. The Unicode Consortium. [永久失效連結]
  9. ^ 存档副本 (PDF). [2019-03-22]. (原始内容存档 (PDF)于2016-07-02).