jTTS (捷通华声语音合成技术)

· 核心技术原理      · 技术特点       · 性能指标     

技术特点

jTTS4.5 核心结构

jTTS 4.5多语种语音合成平台系统结构如上图所示。

jTTS4.5具有如下特性:

  1. 提供特征多样化的音色选择,满足不同行业个性化应用的需求;

  2. 提供多个领域的优化资源包,提高特定领域文本的合成效果;

  3. 针对多种领域提供更加优化的预处理方案,有效保障各个领域下语音合成效果准确、自然;

  4. 改进语料设计方案并扩充了语料资源,为合成系统提供更加优化的候选单元;

  5. 采用独特的韵律层级分析技术和韵律语调节奏模型,合成的声音更加自然、流畅;

  6. 改进语义分析预处理算法,使合成引擎能够更准确的针对上下文语义进行合成;

  7. 改进的数字符号读法自动判断算法,并提供文本分析外部规则的定义和使用;

  8. 支持GB(包括 GB2312, GBK, GB18030),Big5,Unicode,Shift-JIS,ISO-8859-1,Unicode Big

    Endian,UTF8等多种字符集,可正确阅读繁体、不同语种的符号;

  9. 开放式架构,可根据需要,提供中文普通话、粤语、英语等二十余个语种的引擎和音库;

  10. 支持多语种混读;

  11. 支持多线程并发合成,满足大规模的语音合成需求;

  12. 支持背景混音、同步/异步合成模式等功能,通过被动的回调函数方式给用户传递数据。在原有版本

    的主动获取语音数据的基础上又提供了一个选择;

  13. 支持SSML(语音合成标记语言,Speech Synthesis Markup language);

  14. 方便快捷的jTTSLib资源维护工具。


 

 


Copyright©2005, 北京捷通华声语音技术有限公司 All Rights Reserved.
电话: (86-10)82826886, Email: sinovoicemarket@sinovoice.com.cn