语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
应用场景
1.机器人发声
在客服机器人、服务机器人等场景中,与语音识别、自然语言处理等模块联动,打通人机交互的闭环。实现高品质的机器人发声,使得人机交互更流畅自然。
机器人回复 高拟合度合成 自然人机交互
2.有声读物制作
将电子教材、小说等文本材料,以文本文件的形式导入离线语音合成引擎,产生完整的可重复阅读的有声教材或者有声小说,方便用户随时取用。
电子教材 合成朗读音频 丰富学习途径
3.语音播报
在语音导航应用、新闻类 App 中,语音合成可以快速生成高质量的播报音频,实现在开车、走路等不方便阅读消息的情况下,音频消息的即时传达。
地图导航 语音播报 解放双手
功能特色
1.高拟真度
基于业界领先技术构建的语音合成系统,具备合成速度快、合成语音自然流畅等特点,合成语音拟真度高,能够符合多样的应用场景,让设备和应用轻松发声,人机语音交互效果更加逼真。
2.灵活设置
语音合成支持中文、英文、粤语、四川话,也可以合成中英混读语音;支持根据业务需求选择合适的音量、语速等属性;支持离线音频文件和实时音频流两种合成格式;支持电话、移动 App 等多种场景和合成效果选择。
3.声音多样
语音合成支持多种男声、女声的选择,使得音色能够覆盖多样化的应用场景,适用于电话客服,小说朗读,消息播报等场景。本产品支持为企业客户定制发声人。