(这条文章已经被阅读了 163 次) 时间:2001-07-27 17:12:20 来源:马刚 (马刚) 原创-IT
语音合成
在技术和市场的交叉点上
7月16日下午,北京上地信息产业开发区的中关村发展大厦中,捷通软件公司举行了一个关于语音合成技术及应用的记者恳谈会。公司的首席科学家吕士楠教授和公司各位老总约请了部分媒体的记者,就其语音合成技术的最新成果和产品的市场和技术发展前景,充分地交流了意见。
成立于98年的捷通公司,专注于以语音合成技术为核心的语音信息产品的开发,并于去年11月成立了捷通华声语音技术研究中心。捷通华声自创建以来,集结了以吕士楠教授为首的一批优秀的科研人员,以语音合成技术为核心,展开了包括语音识别、自然语言理解、模式识别等方面的技术开发。在前景巨大的语音技术市场即将形成的时候,他们雄心勃勃,对自己的技术充满了信心。
语音合成技术简称TTS(Text-to-Speech),又称文语转换系统,是一种将各种文本文件转换成语音并输出的技术,简单说来,就是让机器把文字资料“读”出来。在人们越来越注重信息的接受和交流的今天,语音技术的发展使信息的传播更加方便,将来的人们不一定非要盯着各式各样、大大小小的荧屏,在所有看不见、不愿看或是不方便看的情况下,我们可以借助TTS技术,让机器把信息说出来。
TTS能为我们做些什么
TTS技术的应用前景主要在三个方面。
首先是TTS应用软件。在应用软件方面,运用TTS技术可以开发出办公、教育、娱乐等各种“会说话”的软件,例如电子文档阅读、有声校对、多媒体人机界面、教学软件、盲人计算机、配音软件和互联网应用等等。
其次是TTS在嵌入式操作系统中的应用。这种应用主要是指将该技术移植到掌上电脑、WAP手机和信息家电等等设备中。譬如目前,在PDA和WAP手机的推广中遇到的最大问题是屏幕太小,识读不方便。而TTS将是打破这个瓶颈的利器——让它们把信息用语音告诉我们而不是文字。
再次就是TTS在CTI中的应用。CTI(Computer Telecomunication Integration)即计算机电信集成,是电信技术和计算机技术在发展和应用中结合在一起。随着两者的逐步融合,计算机领域中有了通信技术,电信设备中也增加了计算机技术的使用。而且,“三网一体”是信息技术发展的必由之路,因此,CTI已经不仅仅是“计算机和电话”的结合,并且还支持传真、Internet数据、视频和语音邮件等等各种各样的信息处理功能。
总之,TTS技术的应用将形成一个巨大的市场。目前没有谁能肯定其将来的国内市场价值是几十亿还是几百亿,但是笔者相信,在不远的将来,TTS技术将时刻出现在我们的身边,无论是家庭生活、工作还是各种公共场所,就象目前的视频技术的应用一样普及。
捷通的眼光和自信
在上地信息产业开发区中,捷通只能算是一个非常小的公司,无论从哪个角度看开,都属于那种正在成长但拥有一定实力的“有潜质的企业”。他们在专注于语音技术的同时,把宝押在了基础核心技术的开发上,可以说具有相当的胆识和眼光。
在这里,让我们简单地认识一下他们重薪聘请的技术带头人、公司的首席科学家吕士楠老先生。吕先生是中科院声学研究所的研究员,国内语音技术的权威之一,数十年来,他一直从事于次声学和语言声学方面的研究,特别是在汉语的声学特征和汉语语音合成技术等方面进行了深入的探索。在汉语语音合成中,他首次提出用基音同步波形叠加技术合成汉语,并且和他的学生一起建成了高清晰度、高自然度的汉语文语转换系统。
毋庸质疑,捷通将吕老先生请进公司,是一个非常精明的决定,加上以两个年轻博士为主要力量的研发团队,使他们在汉语TTS技术上与其它大公司取得了同样的业内地位,虽然这场博弈的参与者中,包括微软中国研究院这样的恐龙级对手。与会时,公司的张总坦言,从公司的资金、规模等方面来说,捷通无法与别的同类公司相比,但是,在语音科学的基础研究和对核心技术的掌握等方面,他们有充分的自信。
从业界的情况来看,捷通的自信是有理由、有根据的。在国内的语音合成研究领域,真正的权威人士其实就那么几个,其中,吕士楠教授是这一领域公认的三个权威专家之一。分布于微软研究院、IBM等大公司的语音技术人才,几乎都是这三个教授所领导的科研队伍中的成员。能够聘请到吕教授这样的技术权威加盟,无疑使捷通的技术在业内处于一流的地位,同时,也极大地提升了公司的品牌知名度,在争取合作伙伴的时候,手里也多了一张最硬的牌。
技术和财富之间有多远的路
会议中,记者们就TTS技术的具体应用方案,以及目前的技术水平与用户需求之间的矛盾等问题向吕教授和捷通公司的负责人询问了大量的问题。主办方对这些问题基本上给予了较为让人满意的回答。同时,通过公司技术人员的演示,让大家对TTS技术最新的产品性能有了感性的认识。
给笔者的感受是,从技术的角度说,除了嵌入式软件的表现,由于压缩技术和硬件设备的问题还差强人意之外,目前的TTS实用技术已经达到了可以广泛地在现实中应用的水准。同时,最初的商业应用的机会也已经到来。但是,真正要把这项极具市场潜质的技术转化为生产力、转化为人们期望中的巨大的市场利润,捷通和其竞争对手们,还有一段不短的路要走。特别是对于捷通来说,机遇和风险都是巨大的。
首先是市场培育的问题。从目前TTS技术在业内的使用范围和相关厂家的态度来看,还远远没有达到人们理想中的广泛应用的程度。在对TTS技术的宣传、赢得合作伙伴的认可这些方面,还需要做TTS技术的公司付出不懈的努力。而依照捷通的实力,独自完成这些工作是不可能的。问题是,由于捷通的产品线比较单一,公司的资金支持规模比较小,所以他们没有可能象其它的竞争对手那样,可以利用别的资源来维持对TTS市场拓展的投入。因此,哪怕拥有最好的技术,也无法确保能活到这个市场真正繁荣的时候。
其次是围绕TTS的商业模式的问题。在目前,TTS还没有形成真正有效和已经被局部固化的商业模式,而且在有针对性地提供具体的应用方案等方面也存在一些需要解决的问题。从捷通目前接到的一些业务单子来看,还只能说是处在市场探索和尝试的阶段。由此引出的话题是,核心技术和商业应用之间的沟壑,捷通如何能顺利跨过。
最后,笔者问吕教授,以前在科研院所做研究和现在在公司里主持技术开发,这种环境的变化给他什么样的感受。吕教授欣然答到,以前只是做论文和实验,然后就没有什么结果了,现在看到自己的研究成果可以转化为具体产品,为广大客户在现实中应用,觉得非常欣慰。
在老教授达观而谦和的微笑中,我们看到了科技转化为商业应用的美好前景。可是,如何让科研成果平滑地转化为适应市场的产品,如何在商业中取得成功,如何能让核心技术真正支撑起我们的民族IT产业,这些问题是无法回避的。
文章写到这里,笔者觉得自己的任务已经完成,剩下的问题就不是媒体所能解决的了。而且,这些问题也不该是吕教授这样的很单纯的科研专家所能回答的。