捷通华声推出新版灵云语音合成(TTS)技术
发布于:2014-05-29 12:46 浏览:
近日,捷通华声宣布推出最新版灵云语音合成技术——jTTS6.1版本,该版本语音播报更加流畅、自然,更加适合于各领域、各行业实时文本信息、及大众生活中的社会新闻、阅读等语音播报,这也是继灵云语音识别技术jASR6.1之后,灵云智能语音交互技术再次实现新的跨越。
浅谈语音合成
语音合成(Speech Synthesis)就是人工合成人类的声音,,简单地讲:就是让计算机“开口说话”。语音合成技术的学名是“文语转换系统”,也常常被称作TTS(Text To Speech)技术,是指将文本信息转变为语音数据,以语音的方式播放出来的技术。该项技术的目的就是让计算机将文字“读”出来,其追求的目标是计算机“读”出的声音清晰、可懂、自然、具有表现力。
国内的汉语语音合成研究虽然起步较晚,但自上世纪八十年代开始,国内汉语语音合成研究基本与国际研究同步发展,为中国语音合成技术后来的广泛应用奠定了坚实的基础。
创建于2000年的捷通华声是国内最早从事中文TTS研究与应用的企业之一,2001年,捷通华声推出了具有国际领先水平的TTS世纪版,是基于大容量真实录音库和韵律层级分析技术的语音合成技术,在自然度和流畅度上达到了一个崭新的水平,标示着中国中文语音合成技术开始进入商品实用化阶段。如今,捷通华声中文语音合成(TTS)技术在国内已处于领先地位,市场占有率超过50%。十几年来,捷通华声始终坚持自主研究语音合成(TTS)、语音识别(ASR)等智能人机交互(HCI)技术,并不断推出粤语、维吾尔语等方言与少数民族语音合成技术,为保证我国中文智能语音技术始终处于世界领先地位做出了主要贡献,也成为推动语音合成技术在CTI等领域中广泛应用的主要力量。
语音合成:CTI系统中不可或缺的关键技术
现在在CTI产业中广泛应用的智能语音交互技术包含了语音合成、语音识别和自然语言理解等智能人机交互技术(HCI),如上所述,语音合成技术在我国HCI技术领域中起步最早,并叩开了语音绚烂多彩的应用大门。语音合成技术解决的主要问题是如何将文本信息转化为声音信息,并能够让机器输出清晰、流畅的连续语音。在语音合成技术应用之前,呼叫中心主要采用录音回放的方式进行语音服务。录音存在高成本、灵活性差、信息滞后等问题,急需寻求一种替代方案。在这一背景下,语音合成技术获得飞速发展及大规模产业应用,在这一时期,国内以捷通华声为代表的高新技术企业迅速切入市场,在金融、电信、能源、交通等行业的呼叫中心中使语音合成技术形成商品化的全面应用。
良好的客服播报声音是获得用户好感的首要因素,当你在拨通客服电话时却不会感觉到电话那端是机器合成的播报声音,这就是灵云语音合成的精彩之处。历经十几年的发展,捷通华声的“灵云TTS”已经发展到支持英、法、德、俄等十三种世界语言。在建设银行中,灵云粤语、英语、韩语等多语种语音合成技术在流畅地为用户服务,而国家电网电话端的语音播报则全程通过灵云语音合成来完成。新版灵云语音合成平台将把朗读能力进一步强化,在具备近似真人发声的基础上,配合呼叫中心进行多元化发展,适应呼叫中心多方面的业务需求。作为呼叫中心最基础、最重要的技术,语音合成在未来依然能与时俱进,发挥其中流砥柱的作用。
智能语音交互:呼叫中心的前景与未来
语音合成虽然发展得比较成熟,但语音对话是一个来往通信的过程,单一的技术无法形成环路,也满足不了日益发展的呼叫中心的需要。于是,语音技术开始由“说”向“听”发展,作为实现人机语音交互的另一种重要支撑——语音识别开始从实验室走向前台。在清华大学科研力量的帮助下,捷通华声的语音识别已取得了突破性的进展,新版灵云语音识别和语音合成组成的“双能力平台”将为国内呼叫中心提供更全面的智能语音解决方案。
系统集成商及软件企业可以在客服质检、IVR导航等系统中将语音合成、语音识别等技术自由组合应用,在语音质检中,企业可以通过灵云语音识别平台实现客户和客服的话者分离,同时把语音转写成文本,再通过自然语言理解对海量语音的内容进行全方位的深入分析,利用数据分析手段达到完善客服质量、分析舆情走向、提升用户体验、增强业务拓展成功性等目的。而在IVR导航中则是用语音合成、语音识别形成一个穿针引线的过程,一方面让用户在流畅自然的播报中获得良好的听觉体验,一方面还可以通过自助语音服务快速获取所需要的内容,节省了企业大量的成本,提高企业和用户双方的沟通效率。捷通华声通过多项智能语音技术为呼叫中心开拓了全新的发展思路,企业可以将多项技术结合,全面提升呼叫中心智能化水平,为业务部门决策、流程制定提供更加有效的支撑。
未来发展,捷通华声将联合清华大学科研力量,更加专注智能语音等HCI技术研究与产业化应用,坚持秉承“合作共赢”的理念,不断为产业界提供先进的智能语音交互技术。
更多信息,请浏览灵云开放平台:www.hcicloud.com
浅谈语音合成
语音合成(Speech Synthesis)就是人工合成人类的声音,,简单地讲:就是让计算机“开口说话”。语音合成技术的学名是“文语转换系统”,也常常被称作TTS(Text To Speech)技术,是指将文本信息转变为语音数据,以语音的方式播放出来的技术。该项技术的目的就是让计算机将文字“读”出来,其追求的目标是计算机“读”出的声音清晰、可懂、自然、具有表现力。
国内的汉语语音合成研究虽然起步较晚,但自上世纪八十年代开始,国内汉语语音合成研究基本与国际研究同步发展,为中国语音合成技术后来的广泛应用奠定了坚实的基础。
创建于2000年的捷通华声是国内最早从事中文TTS研究与应用的企业之一,2001年,捷通华声推出了具有国际领先水平的TTS世纪版,是基于大容量真实录音库和韵律层级分析技术的语音合成技术,在自然度和流畅度上达到了一个崭新的水平,标示着中国中文语音合成技术开始进入商品实用化阶段。如今,捷通华声中文语音合成(TTS)技术在国内已处于领先地位,市场占有率超过50%。十几年来,捷通华声始终坚持自主研究语音合成(TTS)、语音识别(ASR)等智能人机交互(HCI)技术,并不断推出粤语、维吾尔语等方言与少数民族语音合成技术,为保证我国中文智能语音技术始终处于世界领先地位做出了主要贡献,也成为推动语音合成技术在CTI等领域中广泛应用的主要力量。
语音合成:CTI系统中不可或缺的关键技术
现在在CTI产业中广泛应用的智能语音交互技术包含了语音合成、语音识别和自然语言理解等智能人机交互技术(HCI),如上所述,语音合成技术在我国HCI技术领域中起步最早,并叩开了语音绚烂多彩的应用大门。语音合成技术解决的主要问题是如何将文本信息转化为声音信息,并能够让机器输出清晰、流畅的连续语音。在语音合成技术应用之前,呼叫中心主要采用录音回放的方式进行语音服务。录音存在高成本、灵活性差、信息滞后等问题,急需寻求一种替代方案。在这一背景下,语音合成技术获得飞速发展及大规模产业应用,在这一时期,国内以捷通华声为代表的高新技术企业迅速切入市场,在金融、电信、能源、交通等行业的呼叫中心中使语音合成技术形成商品化的全面应用。
良好的客服播报声音是获得用户好感的首要因素,当你在拨通客服电话时却不会感觉到电话那端是机器合成的播报声音,这就是灵云语音合成的精彩之处。历经十几年的发展,捷通华声的“灵云TTS”已经发展到支持英、法、德、俄等十三种世界语言。在建设银行中,灵云粤语、英语、韩语等多语种语音合成技术在流畅地为用户服务,而国家电网电话端的语音播报则全程通过灵云语音合成来完成。新版灵云语音合成平台将把朗读能力进一步强化,在具备近似真人发声的基础上,配合呼叫中心进行多元化发展,适应呼叫中心多方面的业务需求。作为呼叫中心最基础、最重要的技术,语音合成在未来依然能与时俱进,发挥其中流砥柱的作用。
智能语音交互:呼叫中心的前景与未来
语音合成虽然发展得比较成熟,但语音对话是一个来往通信的过程,单一的技术无法形成环路,也满足不了日益发展的呼叫中心的需要。于是,语音技术开始由“说”向“听”发展,作为实现人机语音交互的另一种重要支撑——语音识别开始从实验室走向前台。在清华大学科研力量的帮助下,捷通华声的语音识别已取得了突破性的进展,新版灵云语音识别和语音合成组成的“双能力平台”将为国内呼叫中心提供更全面的智能语音解决方案。
系统集成商及软件企业可以在客服质检、IVR导航等系统中将语音合成、语音识别等技术自由组合应用,在语音质检中,企业可以通过灵云语音识别平台实现客户和客服的话者分离,同时把语音转写成文本,再通过自然语言理解对海量语音的内容进行全方位的深入分析,利用数据分析手段达到完善客服质量、分析舆情走向、提升用户体验、增强业务拓展成功性等目的。而在IVR导航中则是用语音合成、语音识别形成一个穿针引线的过程,一方面让用户在流畅自然的播报中获得良好的听觉体验,一方面还可以通过自助语音服务快速获取所需要的内容,节省了企业大量的成本,提高企业和用户双方的沟通效率。捷通华声通过多项智能语音技术为呼叫中心开拓了全新的发展思路,企业可以将多项技术结合,全面提升呼叫中心智能化水平,为业务部门决策、流程制定提供更加有效的支撑。
未来发展,捷通华声将联合清华大学科研力量,更加专注智能语音等HCI技术研究与产业化应用,坚持秉承“合作共赢”的理念,不断为产业界提供先进的智能语音交互技术。
更多信息,请浏览灵云开放平台:www.hcicloud.com