中日韩笔画 (Unicode区段)
中日韩笔画是一个位于基本多文种平面的Unicode区段,于 U+31C0..U+31E4 收入了38种笔画。Unicode 15.1起还加入了一个表意文字描述字符。
中日韩笔画 | |
---|---|
范围 | U+31C0..U+31EF (48个码位) |
平面 | 基本多文种平面(BMP) |
文字 | 通用 |
已分配 | 39个码位 |
未分配 | 9个保留码位 |
来源标准 | HKSCS–2001 |
统一码版本历史 | |
4.1 | 16 (+16) |
5.1 | 36 (+20) |
15.1 | 37 (+1) |
16.0 | 39 (+2) |
注释:[1][2] |
码表
中日韩笔画 CJK Strokes[1][2] Unicode 联盟官方码表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+31Cx | ㇀ | ㇁ | ㇂ | ㇃ | ㇄ | ㇅ | ㇆ | ㇇ | ㇈ | ㇉ | ㇊ | ㇋ | ㇌ | ㇍ | ㇎ | ㇏ |
U+31Dx | ㇐ | ㇑ | ㇒ | ㇓ | ㇔ | ㇕ | ㇖ | ㇗ | ㇘ | ㇙ | ㇚ | ㇛ | ㇜ | ㇝ | ㇞ | ㇟ |
U+31Ex | ㇠ | ㇡ | ㇢ | ㇣ | | | | |||||||||
注释 |
历史
以下Unicode文档记录了与这一区段相关的提案:
Unicode 版本 |
最终码位范围[a] | 码位数 | L2 ID | WG2 ID | 表意文字小组 ID | 文档 |
---|---|---|---|---|---|---|
4.1 | U+31C0..31CF | 16 | L2/03-411 | Goldsmith, Deborah; Muller, Eric, Unencoded chars in GB 18030 & HK-SCS, 2003-10-31 | ||
L2/04-161R | N2807 | Suignard, Michel; Muller, Eric; Jenkins, John, HKSCS and GB 18030 PUA characters, background document, 2004-06-17 | ||||
L2/04-263 | N2808 | Suignard, Michel, HKSCS and GB 18030 PUA characters, request for additional characters and related information, 2004-06-17 | ||||
L2/05-058 | Whistler, Ken, C. Changes to CJK strokes block, WG2 Consent Docket, Part 1: Unicode 4.1 Issues, 2005-02-03 | |||||
L2/05-026 | Moore, Lisa, WG2 - Unicode 4.1 Consent Docket (B.1.16.1), UTC #102 Minutes, 2005-05-16 | |||||
5.1 | U+31D0..31E3 | 20 | L2/03-387 | N986 | Cook, Richard, Chinese Character Description Language (CDL), 2003-10-26 | |
L2/03-404 | N985 | Bishop, Thomas; Cook, Richard, A Specification for CDL -- Character Description Language, 2003-10-28 | ||||
L2/03-420 | N987 | Bishop, Thomas; Cook, Richard, Character Description Language (CDL): The Set of Basic CJK Unified Stroke Types, 2003-11-04 | ||||
L2/04-221 | N2817 | N1096 | Bishop, Thomas; Cook, Richard, Proposal to add a block of CJK Unified Basic Strokes to the UCS, 2004-06-07 | |||
L2/04-367 | N2864 | N1097 | Bishop, Thomas; Cook, Richard, Proposal to add a block of CJK Basic Strokes to the UCS, 2004-10-25 | |||
L2/06-212 | N3063 | N1180 | Lu, Qin, Proposed additions to the CJK Strokes block of the UCS, 2006-04-03 | |||
L2/06-108 | Moore, Lisa, C.4, UTC #107 Minutes, 2006-05-25 | |||||
N3103 (pdf, doc) | Umamaheswaran, V. S., M48.12, Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27, 2006-08-25 | |||||
L2/23-221 | Koo, Night, Proposal to modify the representative glyph of U+31D2 CJK STROKE P, 2023-10-01 | |||||
L2/23-237R | Lunde, Ken, 19, CJK & Unihan Group Recommendations for UTC #177 Meeting, 2023-11-02 | |||||
L2/23-231 | Constable, Peter, Section 19, UTC #177 Minutes, 2023-12-08, Consensus 177-C14: Accept the proposal to change the representative glyph for U+31D2 | |||||
15.1 | U+31EF | 1 | L2/21-118R | N2492 | Lunde, Ken; Jenkins, John H., Preliminary proposal to add a new provisional kIDS property (Unihan), 2021-08-11 | |
L2/22-136 | West, Andrew, Feedback on Proposals to Encode New Ideographic Description Characters, 2022-07-08 | |||||
L2/22-191 | N2572 | Lunde, Ken; Jenkins, John; West, Andrew, Proposal to encode five new Ideographic Description Characters, 2022-08-24 | ||||
L2/22-227 | SAT Feedback to "Preliminary proposal to add a new provisional kIDS property (Unihan)" (IRGN2492) and "Proposal to encode five new Ideographic Description Characters" (IRGN2572), 2022-08-29 | |||||
L2/22-228 | Fan, Ming, Feedback on IRGN2572 "Proposal to encode 5 new ideograph description characters", 2022-09-02 | |||||
L2/22-247 | Lunde, Ken, 29, CJK & Unihan Group Recommendations for UTC #173 Meeting, 2022-11-01 | |||||
L2/22-241 | Constable, Peter, E.1 29, Approved Minutes of UTC Meeting 173, 2022-11-09 | |||||
16.0 | U+31E4..31E5 | 2 | L2/23-220 | N2647 | Koo, Night, Proposal to encode (disunify) two stroke characters in CJK Strokes block, 2023-10-01 | |
L2/23-237R | Lunde, Ken, 18, CJK & Unihan Group Recommendations for UTC #177 Meeting, 2023-11-02 | |||||
L2/23-231 | Constable, Peter, Section 18, UTC #177 Minutes, 2023-12-08 | |||||
L2/24-044 | Koo, Night, Correcting the proposed name of new character U+31E4 in Unicode 16.0, 2024-02-19 | |||||
L2/24-067 | Lunde, Ken, 32 [Affects U+31E4], CJK & Unihan Working Group Recommendations for UTC #179 Meeting, 2024-04-19 | |||||
L2/24-061 | Constable, Peter, Section 32, UTC #179 Minutes, 2024-04-29, Consensus 179-C17: Accept the proposal to change the name of U+31E4, from CJK STROKE HZXG to CJK STROKE HXG | |||||
|
认同及收录问题
有许多实际存在的笔画,Unicode都没收录。当中有不少是因为被Unicode视为可以与其他笔画合并,例如:
- 斜横( )被视为可与横( )合并。
- 斜竖( )、右斜竖( )被视为可与竖( )合并。
- 左点( )、直点( )被视为可与点( )合并。
- 横捺( )、挑扁捺( )被视为可与挑捺( )合并。
- 扁捺( )被视为可与捺( )合并。
- 横斜( )被视为可与横撇( )合并。
- 挑钩( )被视为可与横钩( )合并。
- 横撇钩( )、挑撇钩( )被视为可与横竖钩( )合并。
- 撇横撇( )被视为可与竖横撇( )合并。
- 撇横( )被视为可与竖横( )合并。
- 撇横弯钩( )被视为可与竖横弯钩( )合并。
- 直撇点( )被视为可与撇点( )合并……等等。
然而,在部分标准里,这些笔画是不可以合并的。例如明体的“辶”部,若把其挑扁捺更换作捺,字形不但变得诡异,甚至可能被视为错字。这些合并的笔画可能只是在某些字、某些情况里与别的笔画相通,并不一定在任何情况下,都能用别的笔画取代。
按Unicode 15.0之前的编码,竖横撇( )被视为可与竖横竖( )合并;但是若“夨”字的撇横撇被更换作竖横竖,将会变成错字。又如横曲钩和横捺钩在中国国家规范 GF 2001-2001《GB 13000.1字符集汉字折笔规范》[3]和传承字形推荐形体[4]里有区分(如“九”和“讯”右边),但是按Unicode 15.0也被视为可合并。2024年的Unicode 16.0收录了横捺钩(或横斜勾,U+31E4)和竖横撇(U+31E5),解决了表述这两个笔画的问题[5]。
另外有少数在香港增补字符集中的笔画或单笔画汉字,在旧版中放在私人造字区里,在新版时改为对应到“中日韩统一汉字”的“扩展B(Ext-B)”区。GBK也将横曲钩定义在私用区,后续在GB 18030-2005内改为U+2E84;GB 18030-2000则在私用区U+E818放置横撇钩,但因为GB 18030-2005收录了扩展B区的汉字却没有修改对应导致GB 18030-2005内存在两个横撇钩(U+200CC和U+E818)[6]。连同部分单笔画汉字,可数出“⺄〇一丨丿丶乀乁乙乚乛亅𠃉𠃊𠃋𠃌𠃍𠃎𠃑𠄌𠄎𡿨”这些字元,详述如下:
编码 | 笔画 | HKSCS旧编码 | 备注 |
---|---|---|---|
2E84 | ⺄ | GBK私用区定义为U+E819,形同“”(31E4)。与“㇈”(31C8)不同。 | |
3007 | 〇 | 形同“㇣”(31E3)。 | |
4E00 | 一 | 形同“㇐”(31D0)。 | |
4E28 | 丨 | 形同“㇑”(31D1)。 | |
4E3F | 丿 | 形近“㇓”(31D3),但也有字型制成形近“㇒”(31D2)。 | |
4E36 | 丶 | 形同“㇔”(31D4)。 | |
4E40 | 乀 | 形近“㇝”(31DD),但也有字型制成形近“㇏”(31CF)。 | |
4E41 | 乁 | 形近“㇝”(31DD)。 | |
4E59 | 乙 | 形同“㇠”(31E0)。 | |
4E5A | 乚 | 形同“㇟”(31DF)。 | |
4E5B | 乛 | 形同“㇖”(31D6)。 | |
4E85 | 亅 | 形同“㇚”(31DA)。 | |
200C9 | 𠃉 | ||
200CA | 𠃊 | F311 | 形同“㇗”(31D7)。 |
200CB | 𠃋 | F30E | 撇挑,非撇横。与“㇜”(31DC)不同形。 |
200CC | 𠃌 | GB 18030-2000在私用区定义为U+E818;GB 18030-2005同时收录二字。形近“㇆”(31C6)。不少字型把U+200CC制成横撇钩,把U+31C6制成横竖钩。 | |
200CD | 𠃍 | F30B | 形同“㇕”(31D5)。 |
200CE | 𠃎 | 形近“㇘”(31D8)。 | |
200D1 | 𠃑 | F30A | 形同“㇞”(31DE)。 |
2010C | 𠄌 | F308 | 竖挑,非竖横。形同“㇙”(31D9),但与“㇗”(31D7)不同。 |
2010E | 𠄎 | F316 | 形同“㇡”(31E1)。 |
21FE8 | 𡿨 | F30F | 形同“㇛”(31DB)。 |
参考文献
- ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25).
- ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29).
- ^ 中华人民共和国教育部,国家语言文字工作委员会. GF2001-2001 《GB13000.1 字符集汉字折笔规范》 (PDF). 2002: 7 [2024-03-14].
- ^ I.字坊编辑部. 傳承字形部件檢校表 (PDF). 传承字形标准化文件 1.36. 一点字坊. 2022年9月17日 [2024-03-14] (中文(繁体)).
- ^ 引用错误:没有为名为
unicode16-newstrokes
的参考文献提供内容 - ^ GB 18030 編碼表. 中文编码网页. [2021-12-03]. (原始内容存档于2022-05-26).