用戶:中日韓越的漢字/關於排序
排序法則:
1.先按照漢字的音序順序(大陸普通話)來排序,拉丁字母或者數字開頭的放在末尾(先數字後字母),若有非拉丁字母的文字則按照羅馬化來排序;
2.按照第一個字的拼音的拉丁字母來排序(u和ü一般混同,只有混同時不能區分才ü排在u後);
3.音節相同的就按字的聲調「陰平→陽平→上聲→去聲→輕聲」的次序來排(另見關於輕聲字);
4.第一個字讀音相同,就按第二個字的讀音來確定(不管第一個字是什麼,同音字混排。若第二個字是數字、拉丁字母或其他字的就在漢字後面排序),以此類推;
5.只有讀音完全相同才可按每個字的筆畫數順序排序(簡體),按照《GB13000.1字符集漢字字序(筆畫序)規範》。
備註:
1.這裏要強調的是,讀音完全相同才逐字按筆畫數排序,如第一個字都讀shí的,就按照下一個字的讀音“时间”、“食品”、“时速”、“石头记”的順序排好,而非“石头记”、“时间”、“时速”、“食品”的筆畫次序,詳細請見下文的「關於同音字」。
2.另外,對於字的讀音有異讀或者不易確定的,一律按照《普通話異讀詞審音表》規定讀音來確定(如「粳米按照jīnɡ mǐ而非ɡēnɡ mǐ來確定」,「密钥按照mì yuè而非mì yɑ̀o來確定」),對於部分生僻字詞以及易念錯的字則會進行相應地注音;
3.下方的列表當中,翹舌音(R除外)以及音節字母為Yu開頭的用粗體字表示(目的是方便排序以及查找,且可糾正方音),而對於聲母J Q X而言,尖音斜體表示,團音正體表示(目的是這三個聲母的字比較多,要通過方言音——《廣韻》為基礎——來分開,如「劍」和「箭」)。
關於同音字
傳統詞典的漢語拼音排序是一個字一個字的進行比較,只有第一個字相同時第二個字才可有排序的資格,然後是第三個字、第四個字……以此類推。
這在筆畫排序上是沒有太大問題的,因為字形都是固定的,不會發生變化,但在拼音排序上就容易產生問題,因為漢語的同音字有很多,而又說是拼音順序,則不能因一個字讀音確定了而直接進行字形上的排序(當然是間接,指的是每個字讀音都一樣時才可給字形排序)。
既然是「漢語拼音次序」,那麼應當以拼音為排序的載體,像下面一些詞組的排序:
平安(pínɡ ɑ̄n)
蘋果(pínɡ ɡuǒ)
平面(pínɡ miɑ̀n)
屏幕(pínɡ mù)
萍水(pínɡ shuǐ)
瓶子(pínɡ zi)
前面都讀pínɡ,顯然要從第二個字開始排序。如果把這幾個詞按拼音順序念出來的話是比較通順的,再比較:
平安
平面
蘋果
屏幕
瓶子
萍水
同樣也是拼音排序,但這個排序法常出現在詞典上,明顯是第一個字相同才能比較第二個字(同音字常按筆畫排序),念出來的話是感覺沒有順序的。
這一點日語、韓語的詞典做得好,它們備註的漢字只是起到備註作用,主要還是按照五十音或者諺文排序,然後就是假名或諺文相同的按漢字字形排序。
漢語的詞典產生這樣排序的原因是古代主要是字典,需要註解的字用大字形表示,這樣的習慣也沿襲到我們現在的詞典當中,顯然不可能出現正規的拼音排序(因為是一個字一個字來的)。
因此,為了改掉這個影響排序的規則,我乾脆直接按拼音排序,對音不對字,除非讀音完全相同。
百度百科條目韻部排序規則
為便於研究音韻學的韻部及古入聲字的分佈情況,我將百度百科條目按照最後一個字的韻母分類,詳情見User:中日韓越的漢字/百度百科條目索引。