对话捷通华声武卫东:以技术为根,以需求为本,推动人工智能产业
在全球疫情爆发、经济下行压力加大双重影响下,国内外资本、人才、贸易、产业链均受到不同程度影响,消费者需求和企业运营模式加速向线上倾斜,智能化场景愈加多元和深入,人工智能尤其是智能语音行业市场逆势上扬,整体利好。
“新发展格局下,产业数字化驱动人工智能向多元化、融合化发展,技术输出‘厚度’增加,‘边界’扩大,智慧城市加速构建,‘泛在智能’初见雏形。”捷通华声董事长武卫东在接受亿欧智库独家专访中,对人工智能产业发展给出了这样的判断。同时,结合自身20余年的发展历程,与亿欧智库针对智能语音市场现状与发展趋势进行了深度探讨。
捷通华声董事长武卫东在2020中国人工智能年会上演讲
中国人工智能产业发展的缩影
第三次人工智能发展浪潮来临前夕。
2000年,几位清华学子怀着“让机器‘能说会听,能写会看,能辨音会认人,能思考会判断’,为人们的生活带来轻松与便捷”的美好愿望,成立捷通华声,是国内最早投入人工智能领域的创业团队之一。
深度学习开启人工智能新一轮繁荣。
2011年,基于深度神经网络的声学模型在大词汇量连续语音识别任务上获得了显著的性能提升,智能语音领域研究开始转向深度学习。这一年,捷通华声对外发布灵云平台,将语音识别、语音合成、语义理解、机器翻译等智能语音、智能语义技术面向产业全面开放。
2016年,语音识别准确率第一次达到人类水平,进入快速落地期。智能语音成为金融、能源、电信、互联网等行业产业提升发展战略的关键词。人工智能发展进入新阶段,成为新一轮产业变革的核心驱动力。
深耕AI二十载,匠心铸就领先。本着对核心技术孜孜不倦的探索精神和务实推进的原则,捷通华声在不断摸索中走出了自己的道路, 即以自主研发的人工智能算法为核心,以市场应用为导向,推进智能语音、智能语义等技术研发持续创新与融合,形成由技术到平台、由产品到解决方案全覆盖的产业生态,全面融入经济社会发展。
智能语音:人机交互的综合体现
语音是人类最直接、最简洁的交流方式。同样,以实现人和机器像人与人一样无障碍交流为使命的智能语音技术,被认为是数智化时代万物智联最方便的入口。相对整个人工智能产业,智能语音产业化程度更高,是所占份额比例较大的细分领域,正以其广阔的产业化应用席卷人们日常生活和工作的方方面面。
“提到智能语音,公众最直观的感受可能是语音识别,但实际上智能语音所包含的内容远比我们想象的复杂。”武卫东介绍到。
完整的智能语音包括声音信号的前端处理、将声音转为文字供机器处理、在机器生成语言之后,用语音合成技术将文本语言转化为声波,从而形成完整的人机语音交互链条。背后涉及声学研究、语言学研究、数字信号处理、自然语音处理研究及垂直场景的深度语义理解,如果要感知声音的起止、讲话人身份和语种等特征,还需另外进行语音唤醒、声纹识别和语种分类等任务。“就像一个拼接的木桶,每一个环节出现短板,都将直接影响最终交互结果。”
捷通华声与清华大学合作,成立灵云人工智能研究中心、清华海峡院人工智能研究中心,不断加强对核心技术的研发投入,强化每一个板块,实现语音识别、语音合成、语义理解、机器翻译等多项技术保持行业领先,同时推动各项技术交叉融合,为人工智能持续发展积蓄力量。
正是对核心技术不断创新和融合发展的坚持,捷通华声在推进各行业智能化发展的过程中形成了自身独特的优势,成长为中国人工智能技术实力的引领者和产业化应用的探索者。
资本是推手,技术是核心,产业需求才是根本
政策与市场双重驱动下,人工智能行业迎来了发展的黄金时代。作为万物智联的入口,语音赛道更是有参与者不断入局。但需要注意的是,这些企业虽然估值很高,盈利能力却很有限,甚至可能还在亏本。
“人工智能产业发展过程中,资本是推手,技术是核心,产业需求才是根本。”武卫东这样向记者释疑。
高新技术是高投入、高回报、高风险的领域,人工智能是引领未来的战略性技术,很受资本青睐。但是,仅依赖资本驱动,容易出现在投入、建设阶段大干快上,却在应用环节掉链子的行为。
“在人工智能领域,技术积累是一个漫长的过程,短期内人工智能服务商难以将技术直接转化收入,缺乏造血机能,也就无法提升实体产业效率和效益。”
风口期快速积累资本,海量宣传扩大企业知名度,再次吸引资本用于扩充疆土,规划盈利目标进行上市,这种模式很难形成核心竞争力,自然缺乏造血机能。
人工智能作为新一轮产业变革的核心驱动力,其本质是科技进步对所有产业的提升。只有当人工智能实现与各传统产业融合应用,才能创造经济和社会价值。“场景决定应用、应用决定市场、市场决定企业发展前景”,武卫东说到。
产业数字化发展初期,通用型方案无法满足定制化需求,每个行业都有自己的问题要解决,有应用场景要突破,需要技术跟场景的深度融合,单一的AI能力已经无法满足。技术和产业不匹配,是现阶段很多AI企业面临的困境。“而且产业落地是有时间周期的,需要人工智能服务商具备一定的行业沉淀以及行业理解,进行能力融合、应用融合和场景融合。只有提升行业的垂直纵深,技术才能拥有更大的落地价值。”
明者因时而变,知者随事而制。经过多年的实战积累,捷通华声对于人工智能的场景化应用经验颇丰,通过AI能力中台和AI数据中台双驱动,广泛赋能智慧城市、数字金融、智慧社区、智慧医疗、数字政府、智能交通等数字化应用场景。
坚持以核心技术突破为根本,以场景深度融合应用为目标,不断将市场趋势和用户需求落地为方案和产品,是捷通华声创造良好造血机能,成为行业内少有的盈利企业,并持续保持领先的秘诀所在。
做有价值的人工智能
在谈及捷通华声未来发展规划时,武卫东表示,捷通华声的初心一直没有变,“让每一家企业都能拥有人工智能,让每一个人都能享受人工智能带来的轻松与便捷。”
在人工智能领域,我们和世界发达国家仍存在一定的技术差距。坚持自主研发,全面增强原始创新能力,在新一轮国际科技竞争中掌握主导权,是中国所有科技作者,包括捷通华声的价值追求。“也是责任,我们将继续探寻人工智能发展趋势,坚持对核心技术的研发投入,力争在行业持续领先。”武卫东表示。
人工智能深度融合实体经济是当前我国重要的经济战略。捷通华声作为智能语音龙头企业,责无旁贷。武卫东认为,“重点在于人工智能应用于传统行业和服务业,提升实体经济智能化水平。捷通华声在服务客户过程中,积累了丰富的智能化升级经验,我们将向全产业推广。”
捷通华声也在积极探索人工智能技术在社区养老等民生场景下的适用性。目前,已形成以灵云社区AI运营大脑为核心,以设备数据信息桥、政府居民连心桥、社区生活便民桥为桥梁,通过灵云邻通沟通、社区安防治理、社区咨询服务、智慧生活服务、社区党建文化、健康养老服务六大场景赋能智慧社区养老建设,打造老年人能用、会用、敢用、想用的智能化产品和服务应用。
武卫东说,“我有两个愿望,一个是看到我们国家科技进步,更加强大。另一个就是尽捷通华声最大的能力,推动中国人工智能产业发展,为经济社会发展贡献一份力量。”