中金:AI端侧落地加速 关注操作系统升级及应用前景

随着AI在端侧的逐渐落地,将带动消费电子终端创新升级,并对云端算力硬件系统尤其是推理侧需求提出更高要求。

智通财经APP获悉,中金发布研究报告称,本周Open AI与谷歌分别发布新一代模型:GPT-4o和Gemini系列模型。该行认为,随着AI在端侧的逐渐落地,将带动消费电子终端创新升级,并对云端算力硬件系统尤其是推理侧需求提出更高要求。

中金主要观点如下:

Gemini 1.5 Pro与GPT-4o有何异同?

我们认为,GPT-4o是端到端模型的创新,带来人机交互方式新突破;谷歌Gemini性能升级,AI能力广泛接入旗下生态。对比来看,两者都是原生多模态大模型,有望引发行业的效仿热情,原生多模态或成为未来发展趋势;但差异点在于,Gemini上下文窗口更大,且定价更具吸引力;GPT-4o模型性能更强,且更强调实际应用场景中的人机交互创新。

AI端侧落地带来消费电子终端人机交互方式变革,关注操作系统升级及应用前景。

在硬件侧,我们认为,此次两大模型发布从四个方面加快了AI落地端侧的进度:1)多模态交互方式革新;2)AI语音助手拟人化;3) AI功能在移动设备的应用前景;4)商业化前景。虽然当前大模型仍以云端算力调用为主,但从当前各家在模型参数压缩的努力,结合端侧商业变现的前景,未来部分算力下沉到端侧将成为必由之路,对应消费电子终端在硬件层面也将迎来创新升级。在操作系统及应用侧,语音助手拟人化程度提升,一方面使AI agent成为可能,另一方面未来交互方式变化或带来流量入口变化,深刻影响生态格局。

云端算力硬件:GPT-4o部分功能的免费开放,Gemini能力的提升或对单位算力成本下探提出要求,AI infra面临大幅优化。

我们看到,当下行业对算力硬件性能、成本的衡量以训练导向逐渐转为推理导向。除了芯片端、网络硬件端(如光模块)持续升级外,系统工程能力也正不断强化:为获得更低的硬件利用率,降低推理成本,优化显存、实施算子融合/算子实现优化、低精度(量化)推理、分布式推理均是主流实现方式。我们认为算力硬件市场有望随应用落地步入以价换量时代,市场规模或将持续增长。

风险

AI算法技术及应用落地进展不及预期,AI变现模式不确定,消费电子智能终端需求低迷。

智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏