语音合成技术走向应用

互联网周刊记者李建平/文 2001/08/10

高处于技术和市场交叉点的TTS技术正在走向应用,相信在不远的将来,TTS技术将出现在我们的 身边,真正实现人机对话。

【eNews消息】作为智能计算机研究的主导方向和人机智能交互的关键技术,语音合成一直受到 业界的广泛关注。据专家预测,五年内,整个中文语音市场将至少在1000亿人民币以上。面对 巨大的国内语音市场,摩托罗拉、IBM、微软等国际大公司纷纷投入大量的资金进行研发,并 推出自己产品。中文语音市场正面临着国际竞争的巨大压力。

7月中旬,在捷通软件公司的语音合成技术及应用的记者恳谈会中,记者了解到我国语音合成 技术有了新进展:出现了可应用于CTI、电信领域以及嵌入式操作系统的中文语音合成系统—— 捷通华声TTS新世纪初版。这个代表当今语音界较高水准的系统就是由捷通华声语音技术研究 中心开发的。 语音合成技术简称TTS(Text-to-Speech),学名文语转换系统,是指利用计算机 将任意组合的文本文件转化为声音文件,并通过声卡、电话语音卡等多媒体设备将声音输出的 技术,简单说就是让机器把文字资料“读”出来。

语音作为思想的一种表达形式,归根结底取决于语意,语言学处理模块是不可缺少的,这也是 当今汉语TTS的薄弱环节。根据捷通华声开发汉语TTS的总体构思,TTS系统从输入文本的语言学 处理开始,得到文本的句法结构和语意焦点,作出合成语音的韵律设计,然后对文本字母串作声 学处理,根据上下文和韵律设计要求,利用音节选择模块在音库选择最佳匹配的音节,并作适当 的修饰,最后将音节拼接起来,经平滑后输出合成语音。

据了解在语音合成方面,合成语音的清晰度目前不成问题,自然度是听众接受这项技术的主要障碍。 捷通华声推出的TTS系统,在自然度上有明显提高,将对这项技术的应用起到重要推动作用。在国内 专注于语音信息产品开发的公司中,捷通公司的历史并不长,但已为客户提供了汉语语音合成技术、 捷通听霸个人电脑语音应用软件、录音汉语智能输入/输出解决方案等产品和解决方案。在资金并不 雄厚的情况下,捷通拿出一半以上资金用于技术开发。去年11月捷通成立了民营企业的第一个语音 技术研究中心——捷通华声,集结了中文语音专家吕士楠教授为首的一批优秀科研人员,展开语音方 面的技术开发。正是这种魄力推动了自主知识产权的语音合成技术的发展。

新展示的语音合成技术已经实现了中英文混读和特殊字符预处理,除了由于压缩技术和硬件设备的 问题,嵌入式软件的表现还差强人意之外,目前的TTS实用技术已经达到了可以广泛地在现实中应用 的水准。据吕士楠教授介绍,TTS技术的应用主要在三个方面。

首先是TTS应用软件。运用TTS技术可开发出各种“会说话”的软件,实现人机对话、语音教学、助读 助听、有声校对等应用。其次是在嵌入式操作系统中的应用。语音合成技术将会克服屏幕窄小的缺陷, 实现收听信息。再次就是TTS在CTI中的应用。电信、银行、证券等行业广泛使用的呼叫中心非常适宜 采用语音合成技术。

处于技术和市场的交叉点的TTS技术正在走向应用。语音合成技术的运用可以提供办公效率,节约成本。 据了解,铁通山东分公司、北京海淀中关村管委会已经采用了捷通公司的自动语音应答系统和语音合成 技术。相信在不远的将来,TTS技术将出现在我们的身边,真正实现人机对话。

 

摘自【互联网周刊】 媒体链接>> 新浪科技

 

 

 


Copyright©2005, 北京捷通华声语音技术有限公司 All Rights Reserved.
电话: (86-10)62972997/98, Email: marketing@sinovoice.com.cn