汉字基因

汉字基因朱邦复提出的一套理论。汉字构造蕴含古人的概念认知,他认为可以整理归纳成概念分类和常识分类,以此深入探求汉字背后的精微意义;并且能应用于电脑系统,使电脑能够有效地处理汉字。朱邦复等人并根据此理论创造出仓颉系统,由于技术特殊且功能强大,受到不少人关注;但由于朱邦复并非专业的文字学研究者,因此他的理论也受到一些人的质疑。

概述

朱邦复认为汉字有六大要素和功能:字形字音字义字码字序字辨,前三者为汉字本有,而后三者是在信息时代为处理需要,必须发展、整理出来的要素。而对汉字进行分析,以得出基因的工作,即称为“汉字基因工程”。

因子(要素)
汉字的六个静态属性。
功能
汉字的六个静态属性能发挥的动态效果。
基因
即“基本因子”。六因子分析至不能再分割者,即为汉字在六种层次上的“基因”。
因子 功能 技术应用
字码 用于汉字的编码 使用仓颉检字法可根据字形得出一个字的字码
字序 用于汉字的检索、排序 以仓颉码为内码。由于仓颉码具有固定序列,可用作排序
字形 即汉字的形体,可被人类视觉感受 字形产生器可根据仓颉码产生字形
字辨 感受汉字的形体而得知其含义的抽象、动态过程 仓颉系统可根据扫描的文字位图,搜寻其中的仓颉字根,转换成相应的仓颉码
字音 即汉字的读音,人类可发出和感受者 仓颉系统可根据仓颉码推断大致读音,但因古今音变剧烈,须做较多例外处理
字义 即汉字可供人认知的意义 对汉字进行“概念分类”和定义,可供电脑的“理解系统”根据仓颉码(内码)理解字义,再加以组合,即可令电脑理解人类的自然语言与思想,甚至可和人类沟通。[1]

码序形辨的分析方法,即是早期朱邦复开发仓颉输入法的过程[2]。而关于字义的分析方法,朱邦复认为,透过人类感官,对事物作“绝对分类”(二分法),求出最小的概念象征因子,即是字义基因;由于汉字是中文的最小组成因子,因此字义基因也是“中文概念基因”[3]

字易

字易》是朱邦复根据汉字基因理论,和网友合作写出的开放文学著作。他认为汉字由于合乎人类的思维原理,因此非常易学,其中也谈及他认为的汉字的“正确学习方法”。

朱邦复认为,汉字的创造和其字义的由来,主要系“约定俗成”,即“视讯之图形基因供约定,而由使用者是否易于接受为俗成”。由于人类的感官类似,因此对同样的视觉图像能产生类似的感受,此即“约定”。数千年以降,读书人若能轻易接受、沿用,即为“俗成”。历史上短暂出现的“死字”,皆系无法“俗成”而放弃者。

他分析了几个巨大的汉字字集,认为其中约六、七千个常用汉字都是由这样的“约定俗成”产生。这些字都有类似的组成逻辑,其中绝大多数可拆分为字首和字身,根据字首(常识分类)和字身(细部定义),就可以联想推理出汉字所表达的“主观思想概念”。而拆分到最后不能再拆的字形,即为最小的概念单位,也就是“汉字基因”中的“字义”因子。

据此,汉字学习极易,只要学习者掌握了正确的方法,对常识加以联想,就可以“触类旁通”而无须“强迫记忆”。而所谓“正确”,即符合“约定俗成之规律”,并且能正确解释古今用法的字义。

要正确地学习汉字,应先习会独体字(含字首及字身),次学组合字。此两者总共约七百余字,却可组合常用之六、七千字。也就是说,只要熟识了七百个字形,即可掌握常用汉字八成的认知。

但同时他也发现,六万字的字集中,仍有约九成的汉字无法用汉字基因理论解释,这些字大部分是名称用字,是“纯粹的形声字”,这种字的创造与理解无干,只能视为一个符号,自然也无法用汉字基因理论解释;其他如“古用字”、“异体字”、“错讹字”亦同[4]。学习这类“符号”的唯一方法是死记硬背,就像大部分无法拆解的英文单字一样。

字义解释

这本书除理论以外,并以常见的字身为纲,用统一的方式解释许多类似字的字义,例如:

  生   指事,會意-甲骨文
      草木長出,活著,起始,不熟。人稱。

    與〔日〕組合為〔星〕
      日所生者,萬物之精也,在夜空為發光的天體。
    與〔金〕組合為〔鉎〕
      金所生,鐵衣,鏽也。
    與〔水〕組合為〔泩〕
      水生,水漲也。
    與〔竹〕組合為〔笙〕
      竹生,管可生音的吹奏樂器。
    與〔心〕組合為〔性〕
      人所認知之起始,事物之本質。
    與〔女〕組合為〔姓〕
      古代從母稱姓,從男稱氏,家族的代表也。
    與〔貝〕組合為〔貹〕
      財生,財富也。
    與〔生〕組合為〔甡〕
      生之再生,眾多狀。
    與〔牛〕組合為〔牲〕
      牛之生,家中生養的動物。
    與〔更〕組合為〔甦〕
      再生,死而復活。
    與〔文厂〕組合為〔產〕
      因文明而生、有價值之物品﹔製造,出生。

朱邦复认为很多当今所谓的形声字,其“声部”亦代表了一定的概念,因此实际上是“形意字”(形声兼会意字),并据此解释字义,与北宋王圣美右文说主张相同。

汉字基因字典

汉字基因字典[5]朱邦复汉字基因理论编纂的一部字典,特点是以汉字字首字身解释字义,去除后来的“错讹字义”,达到“正本溯源”的目的。

他认为,汉字是世界独有的概念文字,其中蕴涵的微言大义,是古人思维的结晶,数千年来行文乃至思考的根本,因此古文能够言简意赅,含意深远。但由于白话文运动鼓吹以“”取代“”,现在的辞典仅解释词义而不谈及该词义的由来;而现代的字典则多以词为基准,将汉字分成一条一条解释,违反汉字本质,令汉字看似费解且难以学习。汉字“本义”被人忘却,现代人中文水平低落,正因不能辨明字义所致。为了揭示字义,消除现今辞典的弊病,故此编写这部字典。[6]

这部字典仅取汉字的“本义”,参照《康熙字典》和《形音义综合大字典》,并根据汉字基因理论,把组合字分为字首字身解释,字首为常识分类,字身为细部定义。从字首字身的“体用”关系联想来说明字义。再按“体用因果”组合为,均以汉字的本义解释。如此每个字、词不再是一条一条独立的解释,而是由一个简短的概念延伸、演化而来,有源有本。

这样的编写方式是因每个汉字都表示一概念,则是把概念加以组合联想而来。以字首字身解释汉字本义,能加深了解其中的概念,阐明汉字的微言大义。也说明只需明了字首字身和组合规律,就能掌握汉字理解的要诀,证明汉字的合理易学,是简化字和其他文字所比不上的。

汉字排序采用第五代仓颉码,是汉字基因中的“字序”因子。

这部字典由朱邦复独力编写,尚未出版。他把初稿放在其网站作参考用,收六千多字。[7]

字例

<闌>
連
@【連】 (倉)卜交方交 ㄌㄧㄢˊ Lianˊ
字首〔辵〕:(用)乍行乍止,行為。
字身〔車〕:(體)有輪子的交通工具。
會意,形聲-金文
(體)道上之車,一輛接著一輛,陸軍的編制。
(用)相互接續。
組合字:鏈槤漣褳慩嗹蓮轋璉鰱蹥翴縺僆摙謰
(體):連長:一連之長,軍隊編制。
(用):連日:日子相接。
   連鎖:鎖相接。
   連枝:枝相接。
   連營:營相接。
   連城:城相接。
   連載:接續登載。
   連襟:接續衣襟,指姐妹之夫。
   連袂:接續衣袂,同行。
   連理:接續之理,指夫婦相愛。
   連環:環相接。
   連任:任相接。
   連合:接合。
   連坐:接坐,指有罪同坐。
   連忙:忙接忙。
   連手:手接手。
   連綴:接綴。
   連結:接結。
   連綿:接如棉。
   連線:相互接線。
   連絡:相互聯絡。
   連姻:相互聯姻。
   連署:接續署。

对汉字基因字典的批评

由于朱邦复不是专业的语文研究者,有人认为他提出的“汉字基因”理论只是“拆字”,不是“释字”。其中有些内容符合汉字学的原理,但有更多不符合汉语的发展和规律。因此运用朱邦复的“汉字基因字典”必须十分谨慎,阅读常带批判角度,用以启发思考不妨,但是不能作为教学和研究的基础。

其中,“汉字基因字典”的一大特色是把大多数的汉字视作表意字,即象形、指事或会意,特别是把很多简单形声字都看成会意。有人认为,这样“把汉字看成与词汇无关的直接表达概念的符号”,是完全错误的汉字观念,是一种附会和向壁虚构。[8]

仓颉码的应用

尽管仓颉码并不见得受到汉字研究学者的全面接受,但是在实务上却足以作为汉字字形辨识的基础。将汉字拆解为字首与字身,或者进一步将字身细分为次字首和次字身。可以将汉字分解为基本的成分,作为计算机软件分析汉字的相似度的基础[9][10],并且建立有用的汉字学习软件的基础[11]

仓颉系统

仓颉系统朱邦复先生及沈红莲女士根据“汉字基因”理论设计的电脑系统,目的是解决汉字在数字化、资讯化上的一切困难,如缺字、编码、储存、排序、输入。

将其进一步发展,仓颉系统还可做到汉字理解(理解系统),以及将文字转为动画(图文系统)等功能。

注释

  1. ^ 朱邦复认为,输入一段文句,令电脑解释、输出。如果输出的结果符合人类的认知,即是“理解”,是“人工智能”的表现。
  2. ^ 参考《第五代仓颉输入法手册 互联网档案馆存档,存档日期2008-09-14.》,朱邦复、沈红莲著,博硕文化出版,2006年10月初版,ISBN 978-957-527-952-3。(线上版页面存档备份,存于互联网档案馆))。
  3. ^ 漢字基因十節課(一). [2008-09-13]. (原始内容存档于2016-07-12). 
  4. ^ 漢字基因十節課(二). [2008-09-14]. (原始内容存档于2016-06-09). 
  5. ^ 汉字基因字典页面存档备份,存于互联网档案馆(繁体中文)
  6. ^ 漢字基因十節課(九). [2008-09-14]. (原始内容存档于2016-08-15). 
  7. ^ 朱邦复工作室留言问答页面存档备份,存于互联网档案馆(繁体中文),第3438、5173、6014等篇。
  8. ^ http://web.hku.hk/~jwilam/chinese/chubf.htm页面存档备份,存于互联网档案馆(繁体中文)
  9. ^ 上海交通大学汉字编码组. 上海汉语拼音文字研究组 , 编. 漢字信息字典. 北京市科学出版社. 1988. 
  10. ^ 宋柔,林民,葛诗利。. 漢字字形計算及其在校對系統中的應用. 小型微型计算机系统. 2008, 第29卷 (第10期): 第1964至1968页. 
  11. ^ Chao-Lin Liu(刘昭麟), Min-Hua Lai(赖敏华), Kan-Wen Tien(田侃文), Yi-Hsuan Chuang(庄怡轩), Shih-Hung Wu(吴世弘), and Chia-Ying Lee(李佳颖). Visually and phonologically similar characters in incorrect Chinese words: Analyses, identification, and applications.. ACM Transactions on Asian Language Information Processing (USA: Association for Computing Machinery). June 2011, 10 (2): 1–39. doi:10.1145/1967293.1967297 (英语). 

参看

外部链接

介绍及评论文章: