可信峰会 | 捷通华声作为核心起草单位支持的大模型系列标准发布
近日,由中国信息通信研究院、深度学习技术及应用国家工程研究中心、人工智能关键技术和应用评测工信部重点实验室主办的2022可信AI峰会线上召开。由捷通华声参编的《大规模预训练模型技术和应用评估方法》同步在峰会期间发布。
近年来,大模型参数规模和模型性能不断创出新高,逐步夯实人工智能技术底座,推动人工智能向着通用化、工业化、集约化发展。在此背景下,中国信息通信研究院联合捷通华声等行业内50余家单位,对大模型的工程化路径进行了深入研究和探讨。面向大模型工程化多个重要阶段构建了大模型标准体系,包含模型开发、模型能力、模型应用和安全可信四个部分,本次会议发布了标准的前两部分。
大模型凭借优越的泛化性、通用性、迁移性,在零样本、小样本任务领域下表现出色,并成为人工智能新基建领域的热点方向之一,同时也是AI产业发展底座的重要一环。捷通华声作为国内领先的人工智能技术、产品与解决方案服务提供商,始终坚持关键核心技术自主研发,致力于持续为客户提供行业领先的AI体验。目前捷通华声已将大模型应用于多项灵云人工智能核心技术算法研究与模型训练过程。
捷通华声在研发灵云语义理解过程中,采用大规模预训练,实现了从大量标记和未标记数据中捕获知识,将知识存储到大量的参数中,并对特定任务进行微调,极大地扩展了模型的泛化能力。
此外,捷通华声通过大模型的自监督学习方法,在一定程度上解决了数据标注过程中人工成本高、周期长、准确度不高的问题。同时,使得小样本的学习也能达到比以前更好的能力,且模型参数规模越大,优势越明显,进而实现使用小样本就可以训练自己所需模型的目的。
相比于传统开发模式,利用已训练大模型进行下游任务时,可有效缩短开发周期。在数字时代发展过程中,大模型能够更好的帮助企业满足业务场景多样化、人工智能需求碎片化等行业数字化转型需求。