泰文 (Unicode區段)

泰文是一個位於基本多文種平面的Unicode區塊,包含了可以用於書寫泰語蘭納語巴利語泰文字符。本區塊基於TIS 620-2533英語Thai Industrial Standard 620-2533製訂。[4]

泰文
Thai
範圍U+0E00..U+0E7F
(128個碼位)
平面基本多文種平面BMP
文字泰文(86個)
通用(1個)
應用泰語
北部泰語
巴利語
已分配87個碼位
未分配41個保留碼位
來源標準TIS 620-2529 → TIS 620-2533英語Thai Industrial Standard 620-2533
統一碼版本歷史
1.0.092 (+92)
1.0.187 (-5)
碼表
點擊此處
註釋:在與ISO 10646統一的過程中,1.0.1版本的泰文區塊刪除了5個字符。[1][2][3]

區塊

泰文
Thai[1][2]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0E0x
U+0E1x
U+0E2x
U+0E3x ฿
U+0E4x
U+0E5x
U+0E6x
U+0E7x
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未分配的碼位

歷史

下列與Unicode相關的文檔記錄了在泰文區塊中定義特定字符的目的和過程:

版本 最終碼位[a] 碼位數 L2英語International Committee for Information Technology Standards ID WG2英語ISO/IEC JTC 1/SC 2 ID 文檔
1.0.0 U+0E01..0E3A,
0E3F..0E5B
87 UTC/1991-058 Whistler, Ken, Thai, Lao 
UTC/1991-048B Whistler, Ken, Thai, Lao, Draft Minutes from the UTC meeting #46 day 2, 3/27 at Apple, 1991-03-27 
UTC/1992-xxx Freytag, Asmus, B. Indic SC, Unconfirmed minutes for UTC Meeting #52, May 8, 1992 at Xerox, 1992-05-12 
L2/02-017 Whistler, Ken, Character Properties for avagrahas, etc., 2002-01-14 
  1. ^ 提案中建議的碼位和字符名稱可能與最終結果不同。

參考資料

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始內容存檔 (PDF)於2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始內容存檔於2017-09-25). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始內容存檔於2016-06-29). 
  4. ^ Chapter 16: Southeast Asia (PDF). The Unicode Standard: Version 14.0 – Core Specification. The Unicode Consortium. 2021-09-14 [2022-08-27]. (原始內容存檔 (PDF)於2021-10-26).