Unicode中的音標符號

Unicode通過已有的書寫系統和添加帶音標字元的額外的區段支援一些音標文字和標記法。這些語音學符號產生於已有的文字,通常是拉丁文、希臘文或西里爾文。Unicode中沒有專門的「國際音標字元」。除官方標準的國際音標外,這些區段還包括了已被現今標準規範廢除的國際音標符號、烏拉爾音標英語Uralic Phonetic Alphabet、過去使用的漢語音調符號等。

音標字元

國際音標利用來自其他書寫系統最常用的標音字母。國際音標常使用拉丁字母、希臘字母和西里爾字母,組合用變音符號還補充語音文字的意義。最後,這些標音字母利用為表達語言學含義特別修訂的字母。一個「修飾字母」不是作為獨立的字母,但作為前面字元的修飾[1]產生有區別的字素,尤其是在國際音標中。例如,ʰ不是用來表達它本身,但修飾了前面的符號。因此,是單獨的區別於t的國際音標符號。然而,這些「修飾字母」的一部分也用於全音素文字。例如,ʿ 用來轉寫閃米特語的ayin或夏威夷語okina,或者 ˚ 轉寫阿布哈茲語 ә

從國際音標到Unicode

輔音

下表包含了國際音標用的音位的Unicode碼點。加粗的碼點表示Unicode圖示提供應用程式注釋,如U+026D ɭ LATIN SMALL LETTER L WITH RETROFLEX HOOK ,HTML:ɭ用於「濁捲舌邊音」。粗斜體表示字元名稱本身標示了發音,如U+0298 ʘ LATIN LETTER BILABIAL CLICK ,HTML:ʘ

雙唇 唇齒 齒齦 齦後 捲舌 唇硬腭
塞音 p 0070 b 0062 0070 032A 0062 032A 0074 032A 0064 032A t
0074
d 0064 ʈ 0288 ɖ 0256
內爆音 ɓ̥ 0253 0325 ɓ 0253 ɗ̪ 0257 032A ɗ 0257 *
擠喉音 0070 02BC t̪ʼ 0074 032A 02BC 0074 02BC ʈʼ 0288 02BC
鼻音 006D 0325 m 006D ɱ̊ 0271 030A ɱ 0271 n̪̊ 006E 032A 030A 006E 032A 006E 0325 n 006E ɳ̊ 0273 030A ɳ 0273
顫音 ʙ 0299 0072 0325 r 0072 *
閃音 ⱱ̟ 2C71 031F 2C71 ɾ 027E ɽ 027D
邊閃音 ɺ 027A *
擦音 ɸ 0278 β 03B2 f
0066
v 0076 θ 03B8 ð 00F0 s 0073 z 007A ʃ 0283 ʒ 0292 ʂ 0282 ʐ 0290
邊擦音 ɬ 026C ɮ 026E *
擠喉擦音 0073 02BC ʃʼ 0283 02BC
擠喉邊擦音 ɬʼ 026C 02BC
敲擊音 ʬ
02AC
ʭ
02AD
近音 β̞̊ 03B2 031E 030A β̞ 03B2 031E ʋ̥ 028B 0325 ʋ 028B ð̞ 00F0 031E ɹ̥ 0279 0325 ɹ 0279 ɻ̊ 027B 030A ɻ 027B ɥ̊ 0265 030A ɥ 0265
邊近音 006C 0325 l 006C ɭ 026D
搭嘴音 ʘ
0298
ǀ
01C0
ǃ
01C3
ǃ / ǂ
01C3 / 01C2
邊搭嘴音 * ǁ
01C1
齦腭 硬腭 唇軟腭 軟腭 小舌 會厭 聲門
塞音 ȶ 0236 ȡ 0221 c 0063 ɟ 025F k͡p 006B 0361 0070 ɡ͡b 0261 0361 0062 k 006B ɡ 0261 q 0071 ɢ 0262 ʡ 02A1 ʔ 0294
內爆音 ʄ 0284 ɠ 0260 ʛ 029B
擠喉音 0063 02BC 006B 02BC 0071 02BC
鼻音 ȵ 0235 ɲ 0272 ŋ͡m 014B 0361 006D ŋ 014B ɴ 0274
顫音 ʀ 0280 *
閃音 *
邊閃音 * *
擦音 ɕ 0255 ʑ 0291 ç 0063 0327 ʝ 029D x 0078 ɣ 0263 χ 03C7 ʁ 0281 ħ 0127 ʕ 0295 ʜ 029C ʢ 02A2 h 0068 ɦ 0266
近音 j 006A ʍ 028D w 0077 ɰ 0270
邊近音 ȴ 0234 ʎ 028E ʟ 029F

元音

 

下表描述了元音及其Unicode / UCS碼點。表格中成對的元音分別地表示不圓唇和圓唇的變化。另外,帶Unicode名稱的字元以粗體標出。帶有額外應用程式注釋的字元以粗斜體標出。直接借用其他文字(拉丁字母、希臘字母或西里爾字母)的以斜體標出。

Unicode元音碼點
本表格表示語音學上的元音圖

圓點兩邊的元音格式為不圓唇 · 圓唇

i · y
0069 0079
ɨ · ʉ
0268 0289
ɯ · u
026F 0075
次閉 ɪ · ʏ
026A 028F
ɪ̈ · ʊ̈
026A 0308 · 028A 0308
 · ʊ
028A
半閉 e · ø
0065 00F8
ɘ · ɵ
0258 0275
ɤ · o
0264 006F
ə
0259
半開 ɛ · œ
025B 0153
ɜ · ɞ
025C 025E
ʌ · ɔ
028C 0254
次開 æ ·
00E6
ɐ
0250
a · ɶ
0061 0276
ɑ · ɒ
0251 0252
元音長度標記 ː
02D0

Unicode區段

不同於標準拉丁字母或希臘字母如m和ɛ,這些符號放在特定的語音學用區段:

從Unicode區段到文字

語音學用的字元放在六個Unicode區段中。

國際音標擴充(U+0250–02AF)

國際音標擴展
IPA Extensions[1]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+025x ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ
U+026x ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
U+027x ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
U+028x ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
U+029x ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
U+02Ax ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
註釋
1.^ 依據 Unicode 14.0

占位修飾詞號(U+02B0–02FF)

占位修飾詞號區段裡面的字元用來和前面的字母組成一個單元(即「修飾」)。如字元U+02B0 ʰ MODIFIER LETTER SMALL H不是簡單的表示上標h(h),但是作為送氣音符號放在字母後面表示送氣,像是。這個區段包含了:

  • 拉丁上標修飾詞號(U+02B0–U+02B8): ʰ 送氣 ʱ 呼氣音 ʲ 腭音化 ʳ, ʴ, ʵ, ʶ 兒化或 r-offglides ʷ 唇化 ʸ 腭化,美式標音系統英語Americanist phonetic notation用(U+02B2)
  • 雜項語音學修飾詞(U+02B9–U+02D7):ʹ ʺ ʻ ʼ ʽ ʾ ʿ ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ ː ˑ ˒ ˓ ˔ ˕ ˖ ˗
  • 間隔用變音符號(U+02D8–U+02DD):˘ 抑揚符 ˙ 上點 ˚ 上圈; ˛ ogonek ˜ 腭化符; ˝ 雙尖音符
  • 基於1989年國際音標附加的(U+02DE–U+02E4):˞ ˟ ˠ ˡ ˢ ˣ ˤ
  • 聲調符號(U+02E5–U+02E9):˥ ˦ ˧ ˨ ˩
  • 擴充注音符號聲調標記:U+02EA ˪ YIN DEPARTING TONE MARKU+02EB ˫ YANG DEPARTING TONE MARK
  • 國際音標修飾字元:U+02EC ˬ MODIFIER LETTER VOICING,不送氣
  • 其他修飾詞號:U+02EE ˮ MODIFIER LETTER DOUBLE APOSTROPHE,用於涅涅茨語
  • 烏拉爾音標修飾詞號(U+02EF–U+02FF):˯ ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
佔位修飾符號
Spacing Modifier Letters[1]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+02Bx ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ʹ ʺ ʻ ʼ ʽ ʾ ʿ
U+02Cx ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ
U+02Dx ː ˑ ˒ ˓ ˔ ˕ ˖ ˗ ˘ ˙ ˚ ˛ ˜ ˝ ˞ ˟
U+02Ex ˠ ˡ ˢ ˣ ˤ ˥ ˦ ˧ ˨ ˩ ˪ ˫ ˬ ˭ ˮ ˯
U+02Fx ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
註釋
1.^ 依據 Unicode 14.0

音標擴充(U+1D00–1D7F)

這個區段和下面的音標擴充增補包括了:

  • 小型大寫字母「ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ」
  • 倒轉的小寫字母「ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ」
  • 額外的小型大寫字母「ʁ ʛ ᴀ ᴁ ᴃ ᴄ ᴅ ᴆ ᴇ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ ᴐ ᴘ ᴙ ᴚ ᴛ ᴜ ᴠ ᴡ ᴢ ᴣ ᴦ ᴧ ᴨ ᴩ ᴪ」
  • 帶硬腭音鉤的小寫字母「ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ」
  • 帶捲舌鉤的小寫字母「ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶩ ᶯ ᶼ」
音標擴展
Phonetic Extensions[1]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D0x
U+1D1x
U+1D2x
U+1D3x ᴿ
U+1D4x
U+1D5x
U+1D6x
U+1D7x ᵿ
註釋
1.^ 依據 Unicode 14.0

音標擴充增補(U+1D80–1DBF)

音標擴展補充
Phonetic Extensions Supplement[1]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D8x
U+1D9x
U+1DAx
U+1DBx ᶿ
注釋
1.^ 依據 Unicode 15.0

聲調修飾詞號(U+A700–A71F)

  • U+A700到U+A707的8個符號不是標準的國際音標符號。它們只是在早期被用於標示漢語的聲調調類(不是調值,平上去入、各分陰陽,所以一共8個符號),標準國際音標規範中沒有這8個符號。
  • U+A717到U+A71A不是標準的國際音標符號,它們用於記錄奇南特克語的聲調符號。
  • U+A71B到U+A71F不是標準的國際音標符號,它們用於記錄非洲語言的聲調
聲調修飾符號
Modifier Tone Letters[1]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+A70x
U+A71x
註釋
1.^ 依據 Unicode 15.0

上標和下標(U+2070–209F)

上標和下標
Superscripts and Subscripts[1][2][3]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+207x
U+208x
U+209x
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未分配的碼位
3.^ 字元¹(U+00B9),²(U+00B2)與³(U+00B3)位於拉丁字母補充-1


參見

參考資料

  1. ^ 存档副本. [2014-08-27]. (原始內容存檔於2021-02-24). 

外部連結