User:魔琴/筹备/方言和少数民族语言协调计划

本文为草案。

中国大陆维基媒体用户组(WMGMC)的方言和少数民族语言协调计划(CPTLEM)[註 1]旨在合理运营汉语方言和中华人民共和国境内少数民族语言的维基媒体项目。项目计划以期促进相关维基媒体计划的孵化、发展和运营,并促进各语言、语料和族群文化的保护。

问题

汉语方言项目面临着其他少数语言项目面临的同样的问题。这样的问题可以参考其他少数语言项目、阿拉伯方言(ary, arz)项目、台湾分会的少数族群维基百科项目等。

同时也有汉语“特色”的言文分离问题。可能大部分的汉语方言使用者根本不会罗马字或者本字的写法。另外并不是所有方言都有合适的书面形式:近代外国传教士创制的罗马字也仅限于东南沿海,本字也需要去考证。即使会写,输入也是一个问题(没有合适的输入法)。关于汉语方言的罗马化和输入法,请见User:魔琴/沙盒/方言拼音

最后有中国大陆地区的网络和法律问题,这就属于房间里的大象不可抗因素了。虽然说标准中文版维基百科也有,但是方言使用者本来就不多了,再被书面语和GFW稀释一下,就更加严峻。

少数民族语言项目,除了如朝鲜语、俄语这样的大语言,少数语言也面临这类似问题。除此之外还有中国大陆地区的“维稳”,以及民族认同问题,可能导致不可预测的行政反应。隔壁某维基百科分叉项目为了这个只敢搞满语。

是否必需?

自粤文维基百科设立,就一直有人质疑中文方言维基百科是否有必要立项。最常见的说法就是「不如去看中文版」,不过中文版也面临着「不如去看英文版」的质疑。

这也并不是汉语方言独有的问题,巴林阿拉伯语维基百科的申请就遭到了社群强烈反对。

技术需要

竖排文字支持

在少数民族语言中,满文(mnc)和周边蒙古语(mvf,实际上是传统蒙文)维基需要竖排支持。

竖排支持也有利于文言项目。

语言转换器

汉语方言项目很可能需要使用语言转换器(LanguageConverter,LC)进行繁简转换。尚不清楚LC对汉字转拉丁转写的支持程度(phab:T193366)。

界面文字的拉、简、繁支持

汉语方言的界面文字这下需要三倍翻译量了。

无代码的方言

目前闽语琼文话雷州话邵将话无ISO 639-3代码。

根据2012版《地图集》的划分,平话和土话有个复杂的情况。该方言区本身无代码,下辖四个次方言:桂北平话桂南平话有代码,湘南土话粤北土话无代码。如果认为广西平话要拆分成桂南、桂北,那么湘南、粤北似乎也应该拿代码;但是2012《地图集》又说桂南、湘南、粤北合称南片,情况就更加复杂了起来。建议先不用动这边,而是先把闽语的问题解决了。

语言归类

目前计划将所辖语言(含汉语方言)分为三类,以反映各语言社群在维基媒体项目的活跃程度。以各项目的维基百科的活跃程度作为分来标准:

  • A类:已有成规模社群和一定活跃度。参考标准:7日总计70笔编辑,不含全域编辑。
  • B类:已有独立项目,活跃度不足,甚至可能濒临废弃。
  • C类:仍在孵化器中,或未建立孵化项目。

汉语方言

  • A类:nan, wuu, yue
  • B类:cdo, hak, gan
  • C类:cjy, cpx, csp, czh, czo, hsn, mnp

东干语

东干语属C类。

少数民族语言

  • A类:略
  • B类:ug, za
  • C类:其他可能需要關注的中國大陸境內的語言

项目支持计划

维基百科

对于维基百科来说,三类项目的支持计划(参考):

  • A类:这类项目仅需宣传。
  • B类:这类项目不仅需要宣传,还需现汉使用者时常维护,并且参与方针指引的草创和更新。
  • C类:这类项目可能需要联系站外社群,讨论支持情况以及书写系统等细节,在条件允许时争取立项。

维基新闻、维基导游

支持母语者撰写维基新闻、维基导游,重点关注方言通行地域的新闻和向导。这可能可以侧面推动各语言维基百科等姊妹项目的进展。

导游条目质量高的话应该译回中文维基百科。

维基文库

设法录入该方言写成的作品,一般是近代传教士的作品。

当没有独立项目时,本计划在多语言维基文库完成。如果作品比较丰富应该争取立项。

维基词典

若有开放著作权的词典数据,应录入英文和中文的维基词典。

中华人民共和国政策

教育部、国家语委曾表示要“科学保护方言、少数民族语言文字”。[1]

注释

  1. ^ Coordinate Project of Topolects and Languages of Ethnic Minorities

参考资料