在近日举办的“可信AI·南京人工智能产业发展论坛”上,中国信息通信研究院(中国信通院)正式揭晓了“可信AI”大模型评测结果,快手“快意大模型”(KwaiYii-175B)在其组织的可信AI大模型评测中荣获最高等级——5级评估,这也是国内首个获得“大语言模型专项”5级评估的大语言模型,彰显了其在人工智能领域的技术创新实力与行业领先地位。
「快意」是快手大模型团队自主研发的大语言模型,能够实现高效的自然语言理解和文本生成,为复杂的知识问答、文案创作、实时翻译、逻辑推理,以及代码编写与分析等任务提供强大支持。
自去年 8 月份快手(01024)发布自研大语言模型「快意」(KwaiYii)-13B 版本以来,半年内快手又相继研发了 66B、175B 版本的大模型,用以适配不同的业务场景的需求。经过数万亿 Tokens 训练的快意大模型在 MMLU、C-Eval 等中英文权威榜单上均取得了行业领先的成绩,在实际用户体验和反馈中可以看到,快意 175B 的模型效果已显著超越了 ChatGPT-3.5,并达到了接近 GPT-4 的水平。
据介绍,“快意”模型通过硬件优化与混合并行算法的结合,实现了GPU集群算力利用效率超50%的提升,同时将推理成本有效控制在开源方案的十分之一,极大地推动了AI应用的经济性和实用性。
在数据处理层面,“快意”模型成功将PB级别的原始数据精炼为TB级高质量训练集,不仅大幅度降低了数据处理的负担,还通过课程学习式的组织方式,确保了模型训练的高效与平稳。此外,该模型覆盖了广泛的领域知识,进一步强化了其在多元化应用场景中的适应能力。
算法创新是快手此次获奖的关键。据悉,快手与国内外顶尖学术机构携手,共同提出了Temporal Scaling Law理论,为超参数优化提供了新的理论支撑。同时,通过创新集成Scaffold-BPE、MiLe Loss等务实高效的前沿算法,快手在提升模型预训练效率和效果上取得了重大进展。
在对齐技术上,快手采用Rejection Sampling等技术显著改善了数据质量,并通过多样本Packing、Iterative DPO/PPO、细粒度Loss等策略,有效提高了训练的稳定性和模型性能。在解码策略上,提出了创新性的并行解码预测策略,大幅提升了推理速度。
接下来,快手还将在即将召开的2024世界人工智能大会(WAIC)上,举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛。届时,快手将发布最新的大模型技术与应用战略,包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。