中文信息处理与汉字表征码

时间:2022-10-02 01:20:42

中文信息处理与汉字表征码

在信息技术高速发展的今天,中文信息处理技术的发展一直以来都存在许多难题,眼看着我国的中文信息处理技术不能展现中文字的特点,中文信息处理也就失去了民族特色;处理技术不能在国内普及,既不能“从娃娃抓起”,更无法向世界推广;输入方法混乱落后,无法统一规范,中文和中文信息处理技术难以向现代化、国际化方向迈进。此外,中文信息处理技术还要经受住中文西化论的频频发难。这些问题长期得不到解决,甚至令专家权威一筹莫展,望而却步。中文和中文信息处理技术的前途与命运形势严峻。

中国空空导弹研究院高级工程师华兴初认为,这些难题是方块中文字独有的、不可避免的固有技术问题,不必大惊小怪。凭中国现有技术水平,解决以上问题并无难度可言,是人们思想上千百年根深蒂固的“中文难”的阴霾,影响、阻碍了中文信息处理技术前进的步伐。

退休后的华兴初倾全力于解决中文信息处理难题上,经十余年艰苦努力,他在错综复杂的矛盾中,终于得出了中文信息处理技术的主要矛盾是民族化、大众化、规范化、国际化,而解决“四化”问题的关键在于编码的结论。也就是说,中文信息处理技术所有问题都可以归结为“四化”问题,而四个化的问题都可以用编码来解决,编码是所有矛盾的主要方面。根据这一理论,华兴初创造出了一种独特的汉字键盘输入法,并以“汉字表征码、编码方法与键盘”为名申报了国家发明专利,并获专利技术交易会特别金奖。可以预期,这项崭新的技术,将以其独特的理论、卓越的性能,开启中文信息处理的全新时代。

背景复杂 要求高远

经华兴初研究发现,中文信息处理一直存在六个问题:第一,中文信息处理没有民族特色,汉字还原率低,加上人们忽视汉字的排序功能,使得中文难学不仅得不到缓解,反而又增加了汉字信息处理难题。把用于教人识字的汉语拼音用来进行汉字信息处理的做法,没有产生预期的对汉语基础教育事业的发展及汉语走向世界的促进作用,全世界只有很少的人能掌握汉语拼音。

第二,中文信息处理技术的难度大,门槛高,别说是小孩,就连大学生也不能普遍接受,而至于外国人,那就更无可适从了。中文信息处理技术及其产品基本上只占领了国内一些具有汉语拼音条件的地方、单位与部门,国内市场正是因其自身的原因受到了限制,手机芯片知识产权92%在外国企业手中。国际市场更难拓展,中文的信息处理技术产业自然也就无力继续对国民经济形成明显的拉动作用。

第三,到目前为止,几千个有关中文信息处理的专利个个远离“四化”,中文计算机输入技术仍然处于低级无序状态,无法统一规范,直接阻碍了我国语言文字工作的信息化以及中文信息处理领域一切工作的规范化进程。

第四,汉字信息压缩技术还没有使中文信息的输出问题彻底解决,看不到中文字能像英文那样随意进、出电脑的可能性。这一问题的存在严重地制约着整个中文信息处理技术向现代化、国际化前进的步伐。

第五,英文不需专门建个字库,可我们却是建不完的字库,说明中文信息处理落后到何等地步。

第六,中文信息处理技术从无到有,一直处于探索之中,理论的缺失和错误是产生各种问题的主因,纯技术的“万码奔腾”式的研究方法反而使问题的解决离“四化”越来越远,主要理论错误是:

1.中文信息处理技术定位不当,人们没有认清它必须与语言文字学和计算机工程学既密切结合却又互相区别的特点及必须赋于面向全球大众的特点,使中文信息处理技术始终远离全球最大的用户群。

2.盲目渲染汉字的笔画,不能历史地、客观地、辩证地、科学地认识部件,把笔画和部件在中文信息处理技术中的地位完全搞了个颠倒。

3.对编码的重要性没有认识,使中文信息处理技术长期走弯路,出现技术倒退。

4.对中文信息处理这样一个错综复杂的系统工程,不用解决系统工程的办法分析与解决所遇到的问题,讳疾忌医,对创新理论与技术叶公好龙,甚至错误打压。阻碍和延误了中文信息处理技术的发展进程约20年的大好时光。

5.滥用智能技术有损中华文化的神圣与尊严,有碍中国国际地位的提升。

技术先进 方法简单

中文信息处理与汉字表征码从理论上和技术上科学、辩证地彻底解决了长期以来困扰中文信息处理领域的诸多弊端与问题。

首先,“表征码”把中文的部件按外形特征分类。它们绝大多数与我们天天见面因而是为人熟知的600多个部件,使人能在浩如烟海的数十万个汉字中见了任何一个字都不陌生,有利于降低学习难度,提高学习兴趣。

其次,“表征码”又把部件分成26个类型,并与26个键盘字母在音、形、义三方面相符。使中文信息处理达到了犹如英文一样的优异性能。因方块字出现的各种问题就此顺理成章地迎刃而解。

这样的汉字信息输入技术使中文信息处理变得只要像英文要背26个大、小写字母那样理解、背熟26个表征符就能让世界上每个大约9岁以上视力、智力正常的人都能学会进行中文信息处理,如同不懂英文的人打英文字母一样。

中文信息处理有重码字,怎么能说中文赶超英文?因为中文信息处理码长只取4位,而英文单词一半以上在8个字母以上。消灭重码,并不很难,无必要盲目追求,只要满足信息处理质量的需要即可。

为了提高信息处理质量,表征码的键盘输入技术,只要几条一听就懂的规则,就能达到见字就查字典,见字就敲键盘进行中文信息处理的效果。

功能卓著 涵盖极广

值得一提的是,中文信息处理与汉字表征码在众多方面都能体现出超越性的功能,以及极度完美的技术链接。首先,“表征码”具备中文排序和信息处理两大功能,而且都超过英文,足以扛起中文走向世界的重任。其次,“表征码”将部件形状、部件外形特征符号(表征符)、键盘字母三者在音、形、义三方面直接进行对应,使汉字能够见字直接翻字典;见字直接敲键盘进行中文信息处理,速度远比英文快;见字就能正确地、迅速地确定任一个汉字在规范化的字库,以及计算机内部码表中的位置。最后,中文信息处理技术的核心是民族化,而民族化的核心是编码、编码的核心是汉字的部件、部件的核心是它们的外形特征。这五个核心环环相扣,就能确保汉字表征码成为名副其实的民族化、大众化、规范化、国际化的编码,是真正属于汉字自已的编码。汉字表征码技术能确保中文信息处理能够涵盖古、今、中、外、繁、简所有汉字;所有视力、智力正常的人都能学会并掌握;涵盖所有汉字信息的应用与管理领域;尚未发现以往所有汉字编码存在的缺点。

影响深远 意义重大

中文信息处理与汉字表征码的发明,破解了千百年中文的种种难题。具备了在全世界推广应用的优越条件。

该项专利技术不仅可以广泛应用于IT行业、计算机、电子字典的键盘技术、中文信息的查、检、管理系统等众多领域,还可打破我国手机芯片知识产权基本由外国掌控的局面,对我国手机行业的发展具有较强的推动作用。该项专利技术的出现,不仅市场前景可以遍及全世界,可节约国家巨额不必要的投资,所产生的经济效益足以再一次拉动我国GDP的明显增长。还能实现中华文化向国际化的大步跨越,大力提升中国的国际地位,加速中文成为又一个国际化的文字与语言的进程。

上一篇:专利成果展示台(2) 下一篇:奢侈品的“他”时代