jTTS (捷通华声语音合成技术)
· 核心技术原理 · 技术特点 · 性能指标
技术指标
|
项 目 |
指 标(行业级、桌面级) |
指 标(嵌入级) |
|
语种 |
中文普通话 |
中文普通话 |
|
中英文混读 |
完全支持(自录音10000词汇,或调用SAPI兼容英文引擎) |
支持单字母发音 |
|
音库 |
女声 |
女声 |
|
音库大小 |
行业级:2.2G/500M
桌面级:100M |
1.2M |
|
句子自然度(*) |
4.34 |
4.09 |
|
短文自然度(*) |
4.35 |
4.26 |
|
句子可懂度(*) |
99.00% |
97.83% |
|
音节清晰度(*) |
88.17% |
74.00% |
|
转换正确率(*) |
89.16% |
86.59% |
|
音频输出格式 |
PCM 16K/8K 16bit/8bit
VOX 8K/6K 4bit
Alaw 8K 8bit, uLaw 8K 8bit |
PCM 8K 16bit |
|
字符集 |
支持GB_2312, GBK, Big5,UNICODE |
支持 GB_2312 , GBK , BIG5 |
|
参数调整 |
音量、基频、语速 |
音量、基频、语速 |
|
数字阅读模式 |
自动判断、电报方式、数目方式 |
|
|
标点阅读模式 |
阅读、不阅读 |
|
|
英文阅读模式 |
自动、强制SAPI、强制自录音、强制字母 |
|
|
用户自定义词库 |
支持 |
|
|
文本类别 |
支持任意文本、Email等 |
支持任意文本、Email等 |
|
文本标注 |
识别特殊控制符,可用于调节语速、语调等 |
|
|
自定义发音 |
用户可自定义英文和符号的发音 |
|
|
编程接口 |
jTTS API 4.0, SAPI 4.0, SAPI 5.0 |
jTTS-ce API 3.0 |
*:取自社会科学院民族研究所语音实验室所做的评测报告 |
|