使用者:魔琴/籌備/方言和少數民族語言協調計劃

本文為草案。

中國大陸維基媒體用戶組(WMGMC)的方言和少數民族語言協調計劃(CPTLEM)[註 1]旨在合理運營漢語方言和中華人民共和國境內少數民族語言的維基媒體項目。項目計劃以期促進相關維基媒體計劃的孵化、發展和運營,並促進各語言、語料和族群文化的保護。

問題

漢語方言項目面臨着其他少數語言項目面臨的同樣的問題。這樣的問題可以參考其他少數語言項目、阿拉伯方言(ary, arz)項目、台灣分會的少數族群維基百科項目等。

同時也有漢語「特色」的言文分離問題。可能大部分的漢語方言使用者根本不會羅馬字或者本字的寫法。另外並不是所有方言都有合適的書面形式:近代外國傳教士創製的羅馬字也僅限於東南沿海,本字也需要去考證。即使會寫,輸入也是一個問題(沒有合適的輸入法)。關於漢語方言的羅馬化和輸入法,請見User:魔琴/沙盒/方言拼音

最後有中國大陸地區的網絡和法律問題,這就屬於房間裡的大象不可抗因素了。雖然說標準中文版維基百科也有,但是方言使用者本來就不多了,再被書面語和GFW稀釋一下,就更加嚴峻。

少數民族語言項目,除了如朝鮮語、俄語這樣的大語言,少數語言也面臨這類似問題。除此之外還有中國大陸地區的「維穩」,以及民族認同問題,可能導致不可預測的行政反應。隔壁某維基百科分叉項目為了這個只敢搞滿語。

是否必需?

自粵文維基百科設立,就一直有人質疑中文方言維基百科是否有必要立項。最常見的說法就是「不如去看中文版」,不過中文版也面臨着「不如去看英文版」的質疑。

這也並不是漢語方言獨有的問題,巴林阿拉伯語維基百科的申請就遭到了社群強烈反對。

技術需要

豎排文字支持

在少數民族語言中,滿文(mnc)和周邊蒙古語(mvf,實際上是傳統蒙文)維基需要豎排支持。

豎排支持也有利於文言項目。

語言轉換器

漢語方言項目很可能需要使用語言轉換器(LanguageConverter,LC)進行繁簡轉換。尚不清楚LC對漢字轉拉丁轉寫的支持程度(phab:T193366)。

界面文字的拉、簡、繁支持

漢語方言的界面文字這下需要三倍翻譯量了。

無代碼的方言

目前閩語瓊文話雷州話邵將話無ISO 639-3代碼。

根據2012版《地圖集》的劃分,平話和土話有個複雜的情況。該方言區本身無代碼,下轄四個次方言:桂北平話桂南平話有代碼,湘南土話粵北土話無代碼。如果認為廣西平話要拆分成桂南、桂北,那麼湘南、粵北似乎也應該拿代碼;但是2012《地圖集》又說桂南、湘南、粵北合稱南片,情況就更加複雜了起來。建議先不用動這邊,而是先把閩語的問題解決了。

語言歸類

目前計劃將所轄語言(含漢語方言)分為三類,以反映各語言社群在維基媒體項目的活躍程度。以各項目的維基百科的活躍程度作為分來標準:

  • A類:已有成規模社群和一定活躍度。參考標準:7日總計70筆編輯,不含全域編輯。
  • B類:已有獨立項目,活躍度不足,甚至可能瀕臨廢棄。
  • C類:仍在孵化器中,或未建立孵化項目。

漢語方言

  • A類:nan, wuu, yue
  • B類:cdo, hak, gan
  • C類:cjy, cpx, csp, czh, czo, hsn, mnp

東干語

東干語屬C類。

少數民族語言

  • A類:略
  • B類:ug, za
  • C類:其他可能需要關注的中國大陸境內的語言

項目支持計劃

維基百科

對於維基百科來說,三類項目的支持計劃(參考):

  • A類:這類項目僅需宣傳。
  • B類:這類項目不僅需要宣傳,還需現漢使用者時常維護,並且參與方針指引的草創和更新。
  • C類:這類項目可能需要聯繫站外社群,討論支持情況以及書寫系統等細節,在條件允許時爭取立項。

維基新聞、維基導遊

支持母語者撰寫維基新聞、維基導遊,重點關注方言通行地域的新聞和嚮導。這可能可以側面推動各語言維基百科等姊妹項目的進展。

導遊條目質量高的話應該譯回中文維基百科。

維基文庫

設法錄入該方言寫成的作品,一般是近代傳教士的作品。

當沒有獨立項目時,本計劃在多語言維基文庫完成。如果作品比較豐富應該爭取立項。

維基詞典

若有開放著作權的詞典數據,應錄入英文和中文的維基詞典。

中華人民共和國政策

教育部、國家語委曾表示要「科學保護方言、少數民族語言文字」。[1]

注釋

  1. ^ Coordinate Project of Topolects and Languages of Ethnic Minorities

參考資料