灵云语音合成:追求高度自然、真实的语音合成效果
发布于:2021-11-16 17:41 浏览:
近日,捷通华声推出搭载最新引擎的灵云语音合成技术,声线细腻、情感丰富、语速真实。得益于核心引擎的深度学习化与高音质声码器,最新灵云语音合成技术的合成效果得到全面提升。
升级后的语音合成技术在各项指标上都达到了历史新高。测评人员给出的MOS值达4.5分,属行业领先。
注:MOS(Mean Opinion Score),平均主观意见分。在国际标准中,统一使用MOS值来评价系统接收到的话音质量。(满分5分)
合成速度方面,灵云语音合成技术同样毫不逊色。从实际体验来说,用户几乎感受不到任何等待时间,语音合成从点击“播放”开始即刻完成。
为了在各个专业领域都能够有良好稳定的语音合成表现,满足不同行业的特殊需求,灵云语音合成针对特定词汇和语句进行个性化定制,通过用户词表、定制录音以及调整判断规则等方法,提高读音、读法和韵律的准确性。经过十多年不同行业的实践经验,捷通华声积累了大量的专业领域词库、预选音库,可为金融证券、天气预报、体育赛事、公交汽运、航空、税务、POI、排队叫号等众多领域提供更专业的语音合成播报,客户能够快速、轻松定制与自己产品属性、形象相匹配的声音,为产品赋能。
针对手机app、智能手表、智能机器人等产品,开发者可通过从云端调用能力的方式,搭建轻量化终端。
b.基于windows系统的灵云语音合成软件
车站、医院、广播站的语音播报,可以直接使用安装在电脑上的灵云语音合成软件,一键播放。
c.私有化部署的灵云语音合成能力平台
在客服中心、呼叫中心等场景,用电话机器人来服务海量用户,需要高并发的语音合成能力。捷通华声提供可私有云部署的语音合成能力平台,与客户IVR系统对接,提供稳定高效的语音合成服务。
音色方面,除了提供男声、女声、童声等基础音色库外,还有更多个性化、饱含情感的音色,包括柔美动听、干净利落、甜美可爱、纯真自然、成熟稳重、热情洋溢、措辞严厉等等,可为各种应用场景提供合适的声音,全面满足企业个性化需求。例如,银行的智能客服需要温柔动听的声音,从而给客户良好的服务体验,而金融行业的欠款催收场景,则需要选择相对严厉的声音,起到警示和催促的作用。
自从2001年在国内率先推出面向市场的语音合成技术以来,捷通华声已广泛服务金融、电信、能源、交通、教育、司法、公安、医疗、互联网等各领域,并出口美国、法国、西班牙、日本、韩国、新加坡等国家。捷通华声愿携手更多产业伙伴,为软件开发商、系统集成商、解决方案供应商等合作伙伴提供优质的产品和全面的技术支持,让更多的企业及个人享受到智能语音合成为生活带来的便利体验。