捷通华声武卫东:全方位 AI 助推新基建,驱动产业智能化转型
日前,捷通华声董事长、CEO武卫东在出席清华企业家协会(TEEC)活动中,做了《全方位AI助推新基建,驱动产业智能化转型》主题分享,就人工智能之于新基建核心价值进行了解读,并介绍了捷通华声基于灵云全方位人工智能开放平台在技术、产品与服务层面的最新进展和助推各行业智能化升级的成果。
以下为分享实录(有整理):
大家好,很高兴今天有这样一个机会和各位T友分享。
今年正好是捷通华声成立20周年。
在人工智能这条路上,我们经历了很多,由最开始人工智能概念普及,到技术突破(深度学习)掀起新一轮浪潮,今年上半年的科技战疫、复工复产,再到这次作为新基建7大领域之一被写入政府工作报告,每个阶段我们都有参与,有些环节更是作为推动者在做。
今天要和大家分享的,就是这些年我们在人工智能领域的一些经验、心得和思考。
人工智能可以理解成让机器具备人的各项能力的技术,是人的手眼感知的延伸,但本质上是工具而不是人力,是为人类所驱使的生产劳动工具。捷通华声在创立之初便定位提供多项人工智能技术。
捷通华声成立于2000年,是较早进入人工智能领域的企业,始终致力于让机器“能说会听、能写会看、能辨音会认人、能思考会判断”。
公司成立前十年是我们完成技术积累的十年。后来随着数据爆发式增长、计算能力提升以及深度学习算法的成熟,人工智能开启了第三次发展浪潮。
正是这期间,捷通华声在2011年推出了国内首个定位于全方位人工智能技术的开放平台——灵云,在这个平台上承载了我们当时设计研发的智能语音、智能语义、智能图像等多方面的人工智能技术。
现在回过头来看,多项技术融合应用正是AI与各行各业交叉融合,实现产业智能化升级的基础,这个也是新基建的特性之一。
经过近10年的发展,现在我们已经拥有语音识别、语音合成、自然语言处理、语义理解、声纹识别、OCR、手写识别、人脸识别、大数据分析等15项核心技术,通过灵云平台向全产业开放。
目前,我们已经构建了全国范围销售与研发网络,北京总部外,在上海、广州、深圳、厦门、天津、成都、西安、武汉、长沙、新疆等地成立分公司,为各行业客户智能化升级提供技术、产品和服务支持。
产学研融合发展,提升核心技术竞争力
捷通华声的发展同时得到了母校(清华大学)的支持,2013年,清华大学产业基金投资捷通华声,双方建立“灵云科技 源自清华”战略合作。2014年,北京清华工业开发研究院与捷通华声联合创建“清华灵云人工智能研究中心”。2015年,清华海峡研究院与捷通华声联合创建“人工智能研究中心”,由张钹院士出任研究中心首席科学家,清华大学教授张长水出任中心主任。
通过与清华大学的产学研合作,灵云AI技术学术研究保持着业界领先,各产品核心技术性能指标都具备很强的竞争力。
在深耕技术、服务产业的过程中,我们也获得了一些成绩和认可,先后获得中关村高新技术企业认证、北京市高新技术企业认证、北京市级企业科技研究开发机构认证,2020 年度北京市“专精特新”第一批名单。因为在今年上半年防疫抗疫、复工复产的突出表现,还入选2020中关村首台(套)重大技术装备试验、示范项目。
期间,我们也有参与国家部委与相关行业组织的人工智能标准制定。国产化这一块也在积极布局,完成与飞腾、兆芯、龙芯等主流处理器,麒麟、统信等主流操作系统,华为鲲鹏云服务的兼容性互认证,支持多元异构环境使用。
还有一些行业协会和媒体的认可。
人工智能之于新基建核心价值在于赋能
工信部数据显示,上半年软件和信息技术服务业实现收入同比增长6.7%,正是人工智能、5G、物联网等技术和传统产业相融合,由产业质变带来的经济量变。
在我看来,人工智能技术主要通过两方面进行产业赋能:一方面它能够创造虚拟劳动力,作为一种新的生产要素可以促进生产力的提高,降本增效;二是创造新的需求和增长点,促进经济的创新。总结下来就是开源节流。
这次政府提出新基建,无论信息基础设施还是融合基础设施都绕不开人工智能。人工智能被誉为云端大脑,依靠5G“高速公路”传来的信息学习和演化,并通过工业互联网连接人和物,推动社会经济向数字化、智能化转型,溢出效益明显。
目前,人工智能已经在众多垂直领域实现应用,较为成熟的领域包括金融、电信、交通、能源、政务、医疗等,而且应用场景越来越多,需求也越来越踊跃。
通过灵云平台,我们将语音识别、语音合成、语义理解、自然语言处理、OCR等AI能力输出,让各个行业能够快速将人工智能技术引入到实际业务中,实现AI与细分场景的结合,完成产业智能化升级。这也是捷通华声的愿景——“赋能百业,共享AI未来”。
十五项自主研发的AI技术全面开放
基于人工智能发展趋势和市场需求,捷通华声也在持续研发并逐步向市场开放更多的人工智能技术,这里是我们目前在灵云平台推出的15项人工智能核心技术,主要覆盖智能语音、智能语义、智能视觉和大数据分析四个层面。
像语音合成和图像处理,捷通华声是国内最早投入研发并实现商业化的企业。最新建成的大兴机场,大家在高铁站听到的站内广播,08年奥运会,上海世博会,都用了捷通华声语音合成的声音。经过多年技术迭代,不仅声音更逼真,拥有男声、女声、童声、卡通等不同音色,严肃、甜美等不同风格,更支持维/藏等少数民族语言及多国语言的语音合成。
也是得益于先发优势和成熟的产学研合作体系,我们不仅拥有自主知识产权的核心技术还形成了自己的行业壁垒,就是海量语料、行业知识库和业务场景。
大家现在会觉得从事人工智能这方面的公司越来越多,但实际上拥有核心技术的企业并不多。
一个原因就是从人工智能发展角度来讲,除了算法算力,还需要数据/场景等关键要素,而这些恰恰是需要一个长期的积累,需要一个韧性。这也是人工智能企业与互联网经济、共享经济或者一些新的商业模式最大的不同。
举一个例子,语音识别,算法摆在这里,要做一个通用模型可能很容易,但是深入到b端企业,深入到行业场景里面,就需要做很多工作,单数据加工处理这一块,我们在全国就有几千人的外包团队在做。没有深耕这个行业的决心和一定的韧性是无法做到长期发展的。
由技术层到平台层、应用层,多维度服务产业智能化升级
当然,有了核心技术还不行,更多的还是通过平台对外展示,与实际业务场景相融合。这些年来,我们通过灵云平台包括私有云平台和公有云平台输出各项能力,与不同行业业务系统进行快速对接,实现AI与细分场景的结合。
在寻求底层技术突破的同时,捷通华声也在进行更加契合客户需求的产品化开发,针对客户的特殊需求,推出了不同形态的应用和解决方案,实现了在技术层、平台层和应用层的全产业链布局。
技术层是以我们完全拥有自主知识产权的15项AI能力在支撑,中间平台层是我们的私有云和公有云平台,采用开放式架构设计,客户可以通过标准的开放接口,灵活调用单项或组合多项AI能力,满足客服、营销、运营、管理、生产等不同业务部门的需求。
灵云AICC全智能客服助力智慧金融、智慧政务建设
在应用层,我们有在国内率先推出的全智能客服解决方案,针对客服中心和呼叫中心的一整套智能化解决方案,包括智能客服、智能语音导航、智能外呼、智能语音质检和实时坐席辅助。
在这一块我们已经积累了丰富的落地经验,客户覆盖银行、保险、能源、电信和政府机构,并且每年都保持一个较高的增长率。
今年上半年,灵云全智能客服解决方案在科技战疫和复工复产过程中也发挥了很大作用。我们推出的智能外呼疫情防控机器人,实现了疫情通知、患者跟踪、流动人员排查、本地居民排查等场景呼出。相比纯人工的方式,不仅信息传递效率更高,同时能够避免工作人员线下调研、排查被感染的风险。
这套系统也登上了工信部科技司的疫情防控信息公式平台,同时也获评了2020中关村的中关村首台(套)重大技术装备试验、示范项目。
灵云全智能客服解决方案同时服务于大多数银行机构,在响应央行、财政部、银保监等五部门联合提出的“加强全国范围特别是疫情严重地区的线上服务,引导企业和居民通过互联网、手机APP等线上方式办理金融业务”要求过程中,起到了有力的支撑作用,也获得了我们客户的一致好评。
例如,我们为某股份制银行搭建的智能语音导航系统,日接听量20万通,回答准确率91%,转人工比例下降至20%,转人工等待时长下降30%,转人工坐席接起率提升至99.78% 。实现了企业客户服务门户的智能化和扁平化,成功避开了防疫工作中无法集中办公为客服中心带来的挑战,同时提升了服务效率和服务体验。
这套全智能客服解决方案在智慧政务中也有广泛应用,我们已经为多省市建设了12345智能服务热线。智能机器人能够提供7*24h多渠道智能化服务,将市民电话精准转接给责任部门,并对服务质量进行智能监督;为政务人员提供智能外呼机器人,进行社情精准调研;通过对服务大数据分析,来辅助政务决策和精准优化政府服务。
这样的案例还有很多,这只是智慧城市的其中一个很小的模块,最近我们在一些城市也展开一些更多工作。
高效转写、字幕投屏,打造数字时代智能会议系统
智能行业解决方案,包括我们针对多人会话场景推出的智能会议系统,它能够提供会议发言的实时转写,字幕投屏展示,会后能够快速的输出会议纪要。这套方案在多地党政系统、企事业单位都有应用。我们通过搭建一套系统,面向大概有300个委办局、包括下面的地级市都能够使用,因为是统一部署,也更好管理。
灵云智声一体机是我们今年重点推出的一款高度集成软硬一体化的产品,具备多语种识别及互译(中-英/日/韩、汉-维/藏等),提供智能语音输入法,字幕、投屏、音视频转写、实时翻译、Office语音模块等特色功能,适用于日常办公、演讲汇报、审讯问询、多人会议等多种语音场景。
除了功能多,另一个特点是所有运算都是在本地端完成的,不需要联网,数据存储在本地端也更安全。
让每个人都能享受人工智能带来的轻松与便捷
AIoT智能物联网这块,像华为盒子、智能电视、导航、车载输入法等很多都是由我们提供的解决方案。
在公有云这方面,我们通过向开发者提供AI能力,这么多年下来,已经积累了10万+开发者,服务用户超过5个亿。比如出国翻译官,官方数据显示有几千万用户,日活在20万,就是用了我们的AI能力。
我们也推出了自己的c端产品,灵云听语,支持实时将声音转为文字和离线音频转写,很受记者、政府公务员、白领、教师和学生欢迎,目前也处在一个快速发展阶段。
赋能百业,共享AI未来
人工智能作为新时代备受关注的技术,其本质是科技进步对所有产业的提升,而并非单独一个新兴行业,只有当人工智能技术在中国真正普遍地应用于传统行业,而不仅仅属于科技巨头时,其经济潜力才会充分彰显。
这就需要上下游产业链的共同努力,捷通华声始终坚持“赋能百业 共享AI未来”发展愿景,将继续发挥在人工智能领域的优势,与合作伙伴优势互补,以工匠精神为产业智能化提供优质的产品和服务。
最后感谢大家的聆听,欢迎大家来捷通华声参观指导,一起探索AI未来。