国泰君安:零一万物推出开源大模型Yi系列 有望引领国内大模型消费级应用

零一万物推出开源大模型Yi系列(参数34B和6B两版本),性能达国际一流水平。

智通财经APP获悉,国泰君安发布研究报告称,自从国外LLaMA开源模型发布后,经过微调的诸多垂域模型快速涌现,所以考虑Yi在预训练阶段尽力保留了模型的通用能力,且上下文容量及中文理解力提升明显,基于国内开源大模型的场景训练和推理将迎来质和量的突破,而且Yi系列量化版本、对话模型、数学模型、代码模型、多模态模型也将以快节奏推出。因此,在阿里等股东的深度合作下,零一万物有望引领国内大模型消费级应用,相关生态拓展潜力巨大。

事件:零一万物推出开源大模型Yi系列(参数34B和6B两版本),性能达国际一流水平。

国泰君安观点如下:

Yi-34B成为全球首个开源超长上下文窗口的大模型,极大提升AI应用体验。

开源大模型Yi-34B拥有340亿参数量,且具有全球最长的200K上下文窗口,可以处理约40万汉字的超长文本输入。相比之下,GPT-4的上下文窗口只有32K,文字处理量为2.5万字。Yi-34B作为全球首个开源超长上下文窗口大模型,为开发者提供了更丰富的语义信息与微调的可能性,所以基于Yi系列模型的应用场景将进一步拓展,相关功能潜力也将进一步释放。

Yi-34B兼顾精度与效率,斩获中英双语“双料冠军”。

Yi-34B在大模型评测中最能反映综合能力的两项指标(MMLU、BBH)上评分极高。在中文理解力方面,Yi-34B位居C-Eval中文模型榜单之首,因而在未来的应用上将能够更好契合国内用户需求。英文理解力方面,Yi-34B在Hugging Face英文测试预训练开源模型排行榜中位列全球第一,以更小的参数量打败Falcon-180B、LLaMA2-70B等知名大模型。

定位为通用底座,Yi剑指To C/消费级的超级应用。

自从国外LLaMA开源模型发布后,经过微调的诸多垂域模型快速涌现,所以考虑Yi在预训练阶段尽力保留了模型的通用能力,且上下文容量及中文理解力提升明显,基于国内开源大模型的场景训练和推理将迎来质和量的突破,而且Yi系列量化版本、对话模型、数学模型、代码模型、多模态模型也将以快节奏推出。因此,在阿里等股东的深度合作下,零一万物有望引领国内大模型消费级应用,相关生态拓展潜力巨大。

风险提示:技术迭代不及预期,AI应用市场拓展节奏不及预期。

智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏