一种智能型数码输入技术的研究与设计

时间:2022-08-13 01:06:49

一种智能型数码输入技术的研究与设计

【摘要】:随着各类PDA 产品及手机的普及, 在手机中使用中文输入法输

入发送中文短消息、中文电话簿等, 以及用手机上网成为越来越多人的选择。受手机体积限制, 在中文输入时就只能依靠拨打手机的数字按键, 因此用数字键简便、高效地输入汉字成为了大众的急需。

【关键词】:智能型;数码输入技术;研究;设计

中图分类号:TP334.2文献标识码: A 文章编号:

引言

由于手持设备的局限性,很适合使用数字编码方案,其也正在被人们运用到各种手持设备上。基于汉字笔形的数字编码方案,是大部分数字编码方案都有的一个特点,而且用户必须掌握拆分笔形的方法才能使用这样的编码方案。智能输入技术是指借助语言自身的规律性来提高输入法性能的技术。最早为了解决同音字引起的重码问题,该技术被拼音输入法所采用,接着又被用来简化用户输入(比如省去韵母,只输入汉字的声母,此时重码率更高了) ,后来又被用于适应不同用户的输入习惯。目前,在拼音输入法中,为实现拼音流到汉字流的转换, 常常使用智能输入技术,从而实现语句级输入。但是,由于受数字键盘的局限性影响,很难实现在手持设备上进行语句级拼音的输入。如果能够很好地结合数码输入技术与智能输入技术,那么在手持设备上,这样的输入法将会有很好的发展前景。

一、智能型的含义

输入法有两个基本目标:(1)减少平均码长,简化用户输入;(2)降低重码字词键选率。但它们往往是相互制约的,对用户的输入进行简化,必然会在一定程度上增加重码率,从而使键选率升高。由于利用语言本身的规律性,智能输入技术把最有可能的字词排列在前面从而提高首字命中率,可以通过建立语言模型,从而表达语言的规律性问题。

二、智能型数码输入技术的“智能型”体现

1.对于所有的重码字词自动输出最佳排序结果

重码字词键选率是衡量这一特性的一个常用标准,键选率越低,相反用户输入就越方便,即首字命中率就越高。这是“智能型”的一个综合表现,也是大部分智能输入法梦寐以求的一个重要目标。

2.具有连续输入的特征

用户不但能够输入词库中的词,还能输入用户自己的特殊短语、词语。对于用户输入的新词,输入法能具有自动记录的功能,再次输入该词时,会更方便。提高首字命中率上,这一特性能发挥了很大的作用,使数码输入法能够具有连续输入的特性,是本文对输入规则改进的初衷。

3.提供了一种灵活的输入方式

由于一些用户的习惯问题,习惯于输入比较完整的输入码,而有的用户则不同。我们知道,只能满足一类用户的需求是不够的,一个智能的输入方案应该能够满足不同类型的用户的需求。为了满足客户的需求,我们尽最大努力使得这项技术具有最高的灵活性。但是,需要注意的是用户需要为这种灵活性也要做出一点观念上的转变,那就是需要顾客多动一下手,在每个字的输入码之间加入分隔符。而这种转变也是通过在使用较低的平均码长时,才能保证一定的首字命中率来进行弥补的。

4.随着用户对这种输入法的使用,能够不断适应该用户

根据用户输入的历史记录来使输入法不断适应该用户。能够对重码字词给出符合该用户的最佳排序,是提高首字命中率特性的最终效果的体现。

三、数码输入编码规则的改进

目前的数码输入法只能输入词库中已存在的字词,但是用户常常需要输入很多词库中没有的词语,如:地名、人名、习惯用法、专有名词、简称、专业词汇、新出现的词汇等等。这些词语的使用变化性很大,因人而异,几乎不可能把它们一一加入到词库中。一种解决办法是采用自定义词库(也称用户词库),但是要求用户自己添加这些词语往往比较麻烦。如果能够自动记录这些词语,那么当用户再次输入相同的词语时,用户会感觉到极为的方便。因为拼音输入法中,几乎每一个字的拼音的组成结构都是由声母和韵母组成的, 通常比较容易做到自动把输入串切分成拼音串。这样如果用户输入了一个词库中没有与之对应的拼音串的词,也能让用户通过选择键来输入一个新词,同时自动的把这个新词添加到自定义词库中。而数字编码方案在需要输入词语的时候,几乎不可能把输入串自动切分成每个字的输入码,因而就不能直接输入每个汉字的编码。一般采用的解决方法是对词语进行专门的编码,使其不需要切分输入串。而相应地,对于词库中没有的词语, 也就无法无法进行输入。本文主要进行了对于输入规则的修改,由词语中的每个单字的输入码组成而不是使用专门的编码,同时在字和字的输入码之间使用分隔符。为了能够更好地利用智能输入技术对数码输入法的输入规则进行改进,需要把它们有机的地结合起来,同时这样对输入法的改进也对其的设计有了更高的要求:(1)用户输入简短的编码时, 大量的重码字词就会产生,这就要求使用智能输入技术对所有重码字词进行有效的排序;(2)用户的输入形式各不相同,使得从输入码到相应字词的检索变得特别复杂,这就要求设计一种能满足相应的检索要求字词码本结构。

四、改进后的优点

1.具有连续输入特征

现在数码输入法大部分只能输入词库中已有的词组,而对于词库中不存在的词组,用户却无法进行连续输入。虽然用户自定义词组的功能大部分的数码输入法都具有,但是却不能自动的进行自定义词组。而系统词库未定义的词组可以用连续输入使得用户输入。通过对词组编码输入规则的改进,从而使得数码输入法能够自动的记录用户输入的新词,也具有了连续输入的特征,也进而使用户再次输入该词组时,极为方便。同时在输入词组时,用户不必太在意词库中有没有该词组,给用户提供了方便。这样就能够更好地利用用户语言模型,使输入法能够不断适应具体用户的使用习惯。

2.能够支持多种的输入方式

由于分隔符的作用,改进后的输入规则,能够允许用户只输入词组中每个字的前面部分编码。并且,这样用户可以根据自己的使用习惯在速度和性能上自行选择。当采用的是较长的编码时,重码率会降低,也相应的降低了需要通过选择键来确认的字词数量;当采用的是较短的编码时,重码率会上升,需要通过选择键来确认的字词数量也会相应的上升。这样,对于不常用的词组,可以采用较长的编码,重码字词也就会相应的减少;同样,经常使用的词组可以采用较短的编码,因为输入法能将重码字词中用户常用的词组总是居于首位。必须利用智能输入技术使这种数码输入法提高首字命中率,同时要降低词组的平均码长。

3.降低数码输入法学习的难度

这里讨论的数码输入法大都是基于笔形编码的,而对于大多数用户来讲,学习拼音输入法要比笔形输入法简单得多。总有一些笔形的处理比较特殊在这些数码输入法中,用户要想掌握好这一输入法,需要花费大量的时间。由于现在有多种灵活的输入方法,改进后的输入规则使得用户遇到不知道对某些笔形如何编码的情况时,仍然能输入字词,进而就降低了学习的难度,有利于数码输入技术的应用和推广。

结语

本文通过分析和改进了数码输入法的输入规则,一种智能型数码输入技术油然而生,使之能够进行连续输入,从而能够与智能输入技术更好地相结合。虽然在客户进行输入时,增加了分隔符,但平均码长却没有增加,这就方便用户能够使用更简洁的输入方式。此项输入技术在首字命中率方面有很大的进展,这也是“智能型”主要体现。从而能够不断适应不同类型的用户的使用习惯;使得输入方法具有更高的灵活性;降低用户学习数码输入法的难度。这样的数码输入技术在手持设备上有着很好的应用和推广前景。

参考文献:

[1]陈一凡,朱亮.汉字键盘输入智能处理软件综述[J].中文信息学报,2003,17(2).

[2]周克兰,张玉华.数码输入法功能的分析与研究[J].苏州大学学报(工科版),2004,24(1).

[3]6马少平,夏莹,张金岭.智能型数字码汉字输入技术[J].电子计算机与外部设备,1999,(2).

[4]王晋豪,杨妙玲.智能笔划输入法的研制和应用[J].艺术科技,2003,

(1).

上一篇:泡沫混凝土在桥头路基处理中的应用 下一篇:工程合同预算与合同外索赔费用问题和对策