北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

产品动态NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

多语种语音识别,多领域语音转写|灵云乐识重磅升级

 发布于:2019-09-09 10:21   浏览:

会议领导讲话录音整理、采访谈话录音整理稿件、课堂录音追溯老师讲解知识,拖音频条人工去听,一直是件费时又磨人的事。

 

为了方便大家将录音转为文本,去年,捷通华声推出了灵云语音云(speech.aicloud.com),为记者、学生、秘书等提供免费录音转写平台。语音识别率高,音字同步校对,灵云语音云广受用户的喜爱。

 

近日,灵云语音云重磅升级,新增英文与四川话的识别,并通过大量后台数据聚类分析,对所有的专业领域进行重新划分。用户可选择用通用、政府、教育、金融等专业领域模型转写录音,实现更高的语音识别率

 

 

多语种语音识别  多领域语音转写

 

 灵云乐识使用指南演示视频


灵云乐识已支持中文、英文,还有四川话语音转写。普通话识别,用户可以选择细分领域:通用聊天领域、电话客服热线、教育学习成长、金融财经投资、政府党政会议、恋爱心理情绪、哲学思想领域、电台广播领域、企业办公会议、国学历史领域、旅游景点地理、网课教学领域、医疗健康养生。

 

 

选择对应领域模型,语音识别效果更佳。转写速度快,1小时的录音几分钟即可转写完成。

 

中文转写结果

 

对于转写出来的结果,可在线进行编辑。用户点击任意需编辑的文字,系统会实时对应到选中文本的音频,边听音频边修改,极大的节省了编辑修正的时间。

 

英文转写结果

 

此外,灵云乐识还支持自动过滤语气词,自动分段等功能。从各个方面优化录音转写结果,提升文本整理效率。转写结果,可以直接进行下载或分享。

 

使用指南

用户可直接输入网址:speech.aicloud.com即可进入语音云网站,另外也可以登录灵云平台(www.aicloud.com)点击语音云服务按钮进入。

 

完成注册流程之后,即可免费使用语音云服务。在网站上点击上传音频,通过选取相应的语音识别模型领域,并选择文件进行上传,目前支持mp3、wav、m4a、spx、opus、amr的音频格式。点击“创建任务”后,只需喝杯咖啡等待几分钟,几个小时的采访稿整理重任就这样完成了。

 

灵云乐说提供语音合成服务,可以将想要合成的文字直接粘贴或导入到网站上,即可合成出优美动听、媲美人声的声音。声音文件可直接导出,也可链接分享。