连词字符
连词字符(英语:Word joiner,简称“WJ”)是一个在Unicode中的格式字符,于部份不使用显式间距(explicit spacing)的语言中用作表达一个不应出现分字的地方。该字符自Unicode 3.2版本(2002年发布)起,以U+2060 WORD JOINER ,HTML:⁠
收录。连词字符不会产生任何空格,故可防止相关位置出现自动换行的情况。[1]
连词字符取代了零宽不换行空格(zero width no-break space,ZWNBSP)字元(一个不建议采用的Unicode字符,其编码为U+FEFF)。U+FEFF字元原拟用于文件开首的位元组顺序记号(Byte Order Mark,BOM),但根据Unicode标准,若该字元非在上述情况下使用,则应视为“零宽不换行空格”般使用。在Unicode 3.2版本起,Unicode联盟不再建议这种故意采用U+FEFF的方式,并强烈建议采用连词字符。[1][2]
参见
参考资料
- ^ 1.0 1.1 Layout Controls (PDF). The Unicode Standard, Version 12.0.0 (The Unicode Consortium). : 871 [2021-06-19]. (原始内容存档 (PDF)于2022-01-19).
- ^ FAQ - UTF-8, UTF-16, UTF-32 & BOM, "What should I do with U+FEFF in the middle of a file?". The Unicode Consortium. [2021-06-19]. (原始内容存档于2021-05-02) (英语).
这是一篇与软件工程相关的小作品。您可以通过编辑或修订扩充其内容。 |