电信级语音增值业务的全面启动,为语音产业增添了更大的发展空间,语音邮件、语音短信、语音互联网、点播等各种语音互动业务,都将大量使用语音合成、语音识别技术。其中,语音合成与语音识别是智能人机交互中的两大关键技术,其发展与语音产业的整体发展密不可分。作为科技奥运项目的承接单位,捷通华声发展了多语种语音合成技术,捕捉到了市场需求的变化。
捷通华声公司的语音技术已经在电信级最新增值业务中被大量使用,其语音产品已经成为主流。在中国移动音信互动( 12590 )平台,中国移动如音在线( 12586 )平台、搜狐、网易、掌中万维、星美传媒、腾讯、华友世纪等新建的综合增值业务平台以及中国联通各省分增值业务平台上,捷通华声公司语音技术产品大量在线应用。该公司最新推出的语音合成产品 ——“ 奥运之声 ” 更是特别突出了 “ 开放式架构 ” ,使语音产品更显智能化。
捷通华声技术总监陈明博士介绍,此次推出的 “ 开放式架构 ” ,打破了以往各个引擎相互独立、无法统一调用的障碍,使语音合成服务具有了良好的可扩充性,公司在集中优势力量,完成科技奥运规定的语音合成引擎开发的同时,为系统实用阶段做好了充分的准备。以往的语音产品,语音合成引擎与应用程序接口是 “ 绑定 ” 的,也就是说,每一个引擎都有自己独立的应用程序接口,无论这些引擎是由同一家厂商还是不同厂商提供,都很难保证接口的一致性,更不可能在同一段文本的处理过程中进行引擎的切换。而 “ 奥运之声 ” 则是将语音合成引擎与应用程序接口剥离开,用户通过一套统一的应用程序接口或网络合成协议来访问语音合成系统,并通过参数指定其使用的引擎;对于整个合成系统,各个语音合成引擎都是相对独立的模块,可以任意添加或移除,在这种结构下,捷通华声定义了一套合成平台与合成引擎的连接标准,任何厂商的语音合成引擎可以按照这种标准进行封装,并接入到该平台下,应用系统无须做任何改动,即可使用新添加的引擎,这就是所谓的 “ 开放式架构 ” 。
在语音产业中, “ 开放式 ” 的理念和基于这种理念所设计的产品,将为下一代语音应用提供坚实的基础,将为中国语音产业的国际化进程起至关重要的推进作用。目前,捷通华声的语音产品已得到了电信增值服务商的广泛认可。鸿联九五信息处理中心总经理雷杨认为,随着电信增值业务的发展,以往的语音产品已经不能满足用户的需求,智能化的语音产品将给声讯和移动增值业务等更广阔的前景。 |