中文输入 好戏在后头 - 软界韬略 - 马刚

(这条文章已经被阅读了 107 次) 时间:2001-06-22 11:13:40 来源:马刚 (马刚) 原创-IT

中文输入 好戏在后头

国内软件业的发展是从中文输入法开始的,对于从业较早的软件人和一些计算机老用户来说,当年“万码奔腾”的热闹景象也许如今依然历历在目。经过近二十年的发展,现在的软件业界门类齐全、品种繁多,输入法和文字处理已不再是人们视野中的焦点。但是,中文输入是汉语人群使用计算机的基础,随着新技术、新思路的不断出现,人们在文字输入方面的要求也越来越高,易用、高效、多途径输入是总的发展方向。

除了传统的键盘输入,又出现了语音输入、汉字OCR以及手写等多种文字录入方法,由于输入速度、识别率及价格等方面的问题,这些新的输入方式目前还没能对键盘输入构成真正的威胁,而更多的是在某些特定的环境使用。

键盘输入本身也在不断进步,并结合各种新技术和新理论,不断推陈出新,向更高的水准迈进。当年“万马奔腾”的复杂局面已不复存在,大部分的输入技术由于各自不同的原因没有推广开,在行业发展的潮流中被淘汰。如今在用户群中占主导地位的不外乎五笔字型、智能狂拼、智能ABC、微软拼音、黑马狂拼和自然码等几种输入方法。本文将针对键盘输入这一领域,从技术、市场这两个方面针对业界几个主要的国内厂商做简单的阐述和分析。

技术篇

去年年初,一种叫做“智能狂拼”的中文输入软件风靡全国,在软件市场上掀起了不小的风潮。推出这个产品的中文之星公司是国内老牌的汉字输入软件提供商,从1992年开始,中文之星系列软件陆续推出了近十个版本,其市场占有率曾达到了90%以上,可称得上是支持Windows操作系统处理中文的“鼻祖”,其中包含的“新拼音”输入法受到用户广泛好评。利用多年来积累的中文信息处理经验,经过三年潜心研发的“智能狂拼”于2000年亮相,其而特点是实现了中文的整句输入,具有很高的正确率,它的核心技术是CLM(中文语音模型)。

这种技术是根据人对语言概念的认知过程,利用计算机分析海量(100亿汉字)的资料,以人脑对概念层认知的过程为指导,采用现代数学原理进行大规模的统计和分析,揭示了中文的基本词汇语法关系,然后得出汉语语音模型。其具体功能是为中文信息智能处理提供了依据和方法,在中文输入软件中的具体应用就是,可以根据上下文关系自动判断正误。

在中文之星公司的研发机构中,笔者看到诸如《说文解字》、《辞海》等大量的汉语工具书,这些是技术人员对汉字语音内在逻辑进行分析和研究的基础。此项技术涉及到大量的基础学科,如语言学、修辞学、思维学等等,并且目前仍然有巨大的发展空间。

在形码输入方面独树一帜的“五笔字型”,曾经是国人的骄傲。当年,由于汉字输入在速度上远远落后于英文,技术上也相当粗糙,极大地影响了中文信息处理的效率。在全球信息化的呼声中,许多人由此认为中文无法适应现代文明的发展速度,加上其本身的复杂性和翻译方面的难度,曾有某些“精英”提出废除汉字,在我国的社会生活中全面引进英文,甚至耸人听闻地叫嚷“汉字不亡则中国必亡”。王码的发明,使中文输入速度第一次超过了英文,在这个层面上给国内的知识界带来了极大的自信心。

二十年过去了,王码技术在不断完善中走到今天,“五笔数码”则是他们新的重磅拳头技术,这应当算是王永民对汉字信息处理的又一个独创性的贡献。“五笔数码”分普及型“6键6码”和快捷型“9键6码”,实现了单手用数字键录入汉字。其特点是易学、易用、重码率低,可以说是“五笔字型”的数字翻版,除了录入速度之外,其它各个方面都有五笔无法企及的优势。

自然码最初是靠“万能挂接”,以及“随意实时造词、自动存储”为自己赢得生存空间的。当时,其它的输入法只支持某一种中文平台,因此在通用性上大打折扣;而且,自造词工具是独立的软件,用户造词时只能用造词工具添加和删除,词组也不能很长。自然码从低层平台做起,把相关的应用功能整合到了一起,以通用性、方便性和专业性而胜出。自然码在其以后的发展中,也一直把兼容和相关技术的整合应用放在第一位。

以上三种是比较有代表性的中文输入技术,在应用功能上各有各的优势,并且有一定的相互结合的可能。其它的诸如黑马智能和二笔输入等等,也都有自己的过人之处,由于采访困难等方面的原因,这里就不作详细介绍了。

在中文输入拼音和型码两大领域,最基本的编码方案之间的较量已经成为过去。大浪淘沙,如今剩下的几个主要厂家,在核心技术方面可以说是各吃一块,不存在多少正面竞争,以后的竞争主要集中在产品设计的智能化、易用性等方面,可以说是不同的应用领域和使用人群的争夺。

但是,键盘汉字输入技术的不断完善是没有止境的,随着社会的发展和用户的需求,各种解决方案之间的较量将一直持续下去。虽然对于目前既有的用户来说,各种输入法的使用习惯已经形成,但是,面对未来的更多新用户,如何吸引他们采用自己的输入方法是摆在商家面前的最大课题。相信各厂家仍将在易学性、易操作性、速度、重码率和对各种软件和平台的兼容性这些方面继续竞争下去。

市场篇

从用户数量来说来说,型码约占10%,这一块基本上被五笔字型所垄断,使用者主要是专业的录入员和一些使用计算机较早的用户。其余的90%被智能狂拼、智能ABC、微软拼音、黑马拼音和自然码所瓜分。

在目前的市场上,相比于其它种类的软件来说,汉字输入软件比较疲软。去年智能狂拼热卖几十万套的风光景象可称为一大奇观。由于品牌机市场的稳定发展,OEM业务成了各厂家重要的利润来源。毕竟对于国人来说,中文输入是紧随操作系统之后的第二个必备软件,是非装不可的。在整机厂商的预装软件中肯定少不了输入法。虽然Windows本身就带有微软拼音和智能ABC等,但是为了让自己的PC适用于尽量多的用户,PC商是不会吝啬其它几种中文输入软件的预装费用的。

中文输入技术的应用前景是相当巨大的。从PDA、手机到信息家电,再到各种中文信息处理系统,哪个都离不开汉字输入。譬如,每个了解到五笔数码的人,首先想到的肯定是手机,无论是短信息的使用还是未来的移动上网,这种单手操作的数字键中文输入法都应该是很好的解决方案。王永民本人对此有很清晰的认识,并以输入技术为核心,大规模介入各种硬件产品的研发,以此作为公司未来发展的主要方向之一。

再譬如CLM技术,除了可以运用到中文拼音输入软件中之外,还可以运用到中文语音输入、手写输入、知识管理和信息智能检索等领域,并且在网络PC、电信、信息家电等窄带语音领域也有广阔的应用前景。据悉,中文之星将要推出市场的几个新产品,都是基于这个核心技术的。

同时,针对Linux操作系统的不断发展,基于Linux平台的汉字输入软件也有可能形成新的竞争。沈阳玳娜软件就盯上了这个领域,虽然目前还看不出具体的市场容量和赢利可能,但是他们认为这个市场是肯定能到来的。

在采访过程中,众商家面对目前市场的不温不火,都众口一词地对未来充满了希望。从我国的IT产业的发展前景来说,这些希望肯定不会落空,当然,谁是下一个市场中的强者,就看各厂商自己的眼光和机会了。