jTTS
(捷通华声语音合成技术)
· 核心技术原理 · 技术特点 · 性能指标
技术特点
jTTS4.5 核心结构

jTTS 4.5多语种语音合成平台系统结构如上图所示。
jTTS4.5具有如下特性:
- 提供特征多样化的音色选择,满足不同行业个性化应用的需求;
- 提供多个领域的优化资源包,提高特定领域文本的合成效果;
- 针对多种领域提供更加优化的预处理方案,有效保障各个领域下语音合成效果准确、自然;
- 改进语料设计方案并扩充了语料资源,为合成系统提供更加优化的候选单元;
- 采用独特的韵律层级分析技术和韵律语调节奏模型,合成的声音更加自然、流畅;
- 改进语义分析预处理算法,使合成引擎能够更准确的针对上下文语义进行合成;
- 改进的数字符号读法自动判断算法,并提供文本分析外部规则的定义和使用;
- 支持GB(包括 GB2312, GBK, GB18030),Big5,Unicode,Shift-JIS,ISO-8859-1,Unicode Big
Endian,UTF8等多种字符集,可正确阅读繁体、不同语种的符号;
- 开放式架构,可根据需要,提供中文普通话、粤语、英语等二十余个语种的引擎和音库;
- 支持多语种混读;
- 支持多线程并发合成,满足大规模的语音合成需求;
- 支持背景混音、同步/异步合成模式等功能,通过被动的回调函数方式给用户传递数据。在原有版本
的主动获取语音数据的基础上又提供了一个选择;
- 支持SSML(语音合成标记语言,Speech Synthesis Markup language);
- 方便快捷的jTTSLib资源维护工具。
|
|