空格
空格是行文為防止混淆或有特定用途的空位。古代中文在書寫上一般不用標點[1],字與字之間亦無空格。空格通常作特定用途,如每段起首須縮入兩個字位[2],尊稱前要留空一格作挪抬等等。
空格 | |
歐洲语言
在拉丁语族和日耳曼语族的语言中,字與字之間以及標點符號與其後的字之間會以空格作間隔。在句號後面,一般以一個空格與其後的字分隔,這種分隔稱為「法式分隔」。[3] 有時候在處理文書上,會在句號後以兩個空格作間隔,這種分隔稱為「英式分隔」。
東亞语言
在東亞语言裡,空格運用的程度有異。中文、日文比較少在文書上使用空格,而日文會在正式場合裡在人名上運用空格,以分隔姓氏與名字。在韓文,書寫的時候運用大量的空格,稱為「隔寫法」(韓文:띄어쓰기)。韓文的隔寫法有標點符號的作用。比如說「아버지가방에들어가신다.」這個句子會因不同的隔寫方式,而有不同的意思:
|
中文排版
在使用中文電腦初期,文書處理及網頁編輯工具大多改自英文軟體,與BIG5編碼並不完全相容;英文ASCII字元編碼為1byte、中文BIG5則是2byte,假使邊界或斷行排版沒設定好,不足容納中文字時會造成該字或整段亂碼,因此比照英文排版在各字間加半形空格(多出1byte緩衝)以避開程式錯誤。
及至中文文書和網頁編輯軟體發展成熟後,不再產生亂碼情形,也就無須在字間加空格。少數香港媒體新聞網頁直到2010年代初,如香港電台當時還維持早期排版方式[4]。
Unicode定義
Unicode定義了大量空格符號,列表如下:
編碼 | 不換行 | 用于URL | HTML | 名稱 | 區域 | 顯示 | |
---|---|---|---|---|---|---|---|
U+0009 | 文字制表符(Character Tabulation) | 基本拉丁文 | |||||
同ASCII字元0x09 | |||||||
U+0020 | 空格 | 基本拉丁文 | |||||
普通半形空格,同ASCII字元0x20 | |||||||
U+00A0 | ✓ | | 不換行空格(No-Break Space) | Latin-1 Supplement | |||
同U+0020,但不換行 | |||||||
U+1680 | ✓ | 歐甘空格(Ogham Space Mark) | 歐甘字母 | ||||
用於分隔歐甘文單詞。通常情況下顯示為一條直線,而在沒有字干的字型中會顯示成空格。需要歐甘文字型。 | |||||||
U+180E | ✓ | 蒙古文元音分隔符(Mongolian Vowel Separator,MVS) | 蒙古文 | | |||
作用近似不換行空格,用於蒙古文時使得詞尾兩個字母呈現不同的字形。自Unicode 6.3.0起不再定義為空格。 | |||||||
U+2002 |   | En空格(En Space)或Nut | 通用標點 | ||||
與en同寬(em之一半)。 | |||||||
U+2003 |   | Em空格(Em Space)或Mutton | 通用標點 | ||||
與em同寬。 | |||||||
U+2004 |   | Em三分之一空格(Three-Per-Em Space)或Thick Space | 通用標點 | ||||
em之三分之一寬 | |||||||
U+2005 |   | Em四分之一空格(Four-Per-Em Space)或Mid Space | 通用標點 | ||||
em之四分之一寬 | |||||||
U+2006 | Em六分之一空格(Six-Per-Em Space) | 通用標點 | |||||
em之六分之一寬。電腦字型有時與U+2009等同。 | |||||||
U+2007 | ✓ |   | 數字空格(Figure Space) | 通用標點 | |||
用於分隔數字之定位符,與單一數字同寬 | |||||||
U+2008 | 標點空格 | 通用標點 | |||||
與同字型之窄標點同寬,即句號或逗號(西方語文)之寬度[5] | |||||||
U+2009 |   | 窄空格(Thin Space) | 通用標點 | ||||
em之六分之一(有時設計成五分之一)寬。建議用作SI單位數字之千位分隔符。與U+2002至U+2008不同,其寬可根據排版調整[6] | |||||||
U+200A | 髮寬空格(Hair Space) | 通用標點 | |||||
窄於窄空格(thin space) | |||||||
U+200B | 零寬空格(Zero Width Space,簡稱「ZWSP」) | 通用標點 | | ||||
U+200C | ✓ | ‌ | 零宽不连字(Zero Width Non Joiner,簡稱「ZWNJ」) | 通用標點 | | ||
U+200D | ✓ | ‍ | 零宽连字(Zero Width Joiner,簡稱「ZWJ」) | 通用標點 | | ||
U+202F | ✓ | 窄式不換行空格(Narrow No-Break Space) | 通用標點 | ||||
作用近似U+00A0不換行空格。用於蒙古文時寬度通常為普通空格三分之一,用於其他文字時寬度有時相當於U+2009窄空格。 | |||||||
U+205F | 中數學空格(Medium Mathematical Space,簡稱「MMSP」) | 通用標點 | |||||
用於數學方程式。em之18分之4寬[7]在數學排版領域,空格寬度通常以十八份之幾的方式給定;4/18 em可用於數個情況,例如數式a + b中a與 +及 +與b之間[8] | |||||||
U+2060 | ✓ | ✓ | 文字連接符(Word Joiner) | 通用標點 | | ||
同U+200B,但該處不能換行。Unicode 3.2新增,以代替U+FEFF字元廢止之零寬不换行空格功能 | |||||||
U+3000 | 表意文字空格 | CJK符號及標點 | |||||
與CJK文字同寬(全形) | |||||||
U+FEFF | ✓ | ✓ | 零寬不换行空格(Zero Width No-Break Space) = 位元組順序記號(Byte Order Mark,簡稱「BOM」) | Arabic Presentation Forms-B | | ||
主要用作位元組次序標記字元。原來之不換行指示功能於Unicode 3.2起廢止,代之以U+2060。 |
Unicode在控制图形(Control Pictures)區域亦提供一些具像字元用來代表空格,例如␠
(Symbol For Space,U+2420)、␢
(Blank Symbol,U+2422)和␣
(Open Box,U+2423)[9]。有些文書處理軟件如Microsoft Word會使用间隔号·
代表半形空格。
注釋
- ^ 御定康熙字典 (四庫全書本)/卷28#讀:
"又集韻韻㑹 𡘋大透切音豆義同 周禮天官小宰宮正註鄭司農讀火絶之徐音豆 又增韻句讀凡經書成文語絶處謂之句 語未絶而點分之以便誦詠謂之讀 今祕省挍書式凡句絶則點於字之旁 讀分則微點於字之中閒";可見直到清朝時書寫習慣都不加標點,研究解讀時才另加標記輔助。
詳見标点符号#歷史, 古人書寫實物見: 蘭亭集序。
《漢典》:句讀 (页面存档备份,存于互联网档案馆) - ^ 沿自1919年胡適、周作人、錢玄同等向中華民國教育部提出《請頒行新式標點符號議案(修正案)》存档副本. [2010-09-30]. (原始内容存档于2009-12-13).[1] (页面存档备份,存于互联网档案馆)
- ^
Einsohn, Amy. Punctuation, Eyeballing every mark. The Copyeditor's Handbook: A Guide for Book Publishing and Corporate Communications 2nd. Berkeley, Los Angeles, London: University of California Press. 2006: 113 [2010-04-25]. ISBN 9780520246881.
If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon ...
- ^ 天文台明日考慮需否發三號強風信號. 香港電台. 2012-07-21 [2012-07-22]. (原始内容存档于2013-04-30) (中文(香港)).
- ^ Character design standards - space characters. Character design standards. Microsoft. 1998–1999 [2009-05-18]. (原始内容存档于2018-01-09).
- ^ The Unicode Standard 5.0, printed edition, p.205
- ^ General Punctuation (PDF). The Unicode Standard 5.1. Unicode Inc. 1991–2008 [2009-05-13]. (原始内容存档 (PDF)于2011-09-17).
- ^ Sargent, Murray III. Unicode Nearly Plain Text Encoding of Mathematics (Version 2). Unicode Technical Note #28. Unicode Inc: 19–20. 2006-08-29 [2009-05-19]. (原始内容存档于2021-03-08).
- ^ Control Pictures (PDF). Unicode, Inc. [2017-03-06]. (原始内容存档 (PDF)于2021-04-20).
延伸閲讀
- Saenger, Paul. Space Between Words: The Origin of Silent Reading. Stanford, Calif: Stanford University Press. 1997. ISBN 9780804726535. OCLC 35548786.