五矿证券:OpenAI/谷歌/微软纷至沓来 AI大模型开启价格战

作者: 智通财经 刘璇 2024-05-24 16:25:40
AI 大模型厂商将通过价格战来抢占市场,行业将迎来整合期。通用大模型开始进入“以厘计价”的时代,而大模型的训练需要花费大量的算力,价格战最终落地到厂商的资金和技术实力,因此,该团队认为大模型赛道将迎来整合。

智通财经APP获悉,五矿证券发布研报认为,AI 大模型厂商将通过价格战来抢占市场,行业将迎来整合期。通用大模型开始进入“以厘计价”的时代,而大模型的训练需要花费大量的算力,价格战最终落地到厂商的资金和技术实力,因此,该团队认为大模型赛道将迎来整合。WoA PC 趋势给 Arm 处理器厂商带来机遇。微软Copilot+PC 的推出说明,伴随着AI在端侧布局渗透率的提升,PC处理器架构将迎来变革。

1、OpenAI/谷歌/微软纷至沓来,AI大模型开启价格战

1.1 OpenAI春季发布会:语音、视觉和文本混合输入输出的多模态大模型GPT-4o

美国当地时间2024年5月13日,OpenAI在“春季新品发布会”发布GPT-4o(“o”代表“omni”,Omni源自拉丁语“omnis”,有“全能、全部”之意)。本次新版本的推出包括以下亮点:

1) 以丰富视觉、音频等多模态输入/输出、降低时延,增强人机交互能力。

在交互内容上,GPT-4o接受文本、音频、图像和视频的任意组合作为输入,生成并输出文本、音频和图像的任意组合。此外,在交互速度上,GPT-4o语音延迟大幅降低,能在232毫秒(平均为320毫秒)内回应音频输入,这与自然对话中人类约300毫秒的响应间隔时间相似。

GPT-4O将传统三个独立的语音模型纳入同一个神经网络降低时延的同时减少信息丢失。过去用户采用语音模式和ChatGPT交谈时,需要经过由三个独立模型组成的管道,包括:音频转为文本模型、GPT-3.5 或 GPT-4、文本转音频模型,整个过程会出现2.8秒(GPT-3.5)到5.4秒(GPT-4)的延迟。

在发布会和官网上,OpenAI演示了基于GPT-4o,使用摄像头识别手写内容、两个GPT-4o之间进行互动和唱歌、数学/西班牙语教学等,从模型开发商的角度给用户定义了更加广泛的应用场景。目前对新模型的能力仍处于探索阶段。

2) 价格更加优惠

用户免费有限次使用;付费用户价格是GPT-4 Turbo的一半。免费用户可以使用GPT-4o发送的消息数量将受到限制,当达到限制后将自动切换到GPT-3.5。付费用户将获得5倍调用额度,并能最早访问全新macOS桌面App和下一代语音及视频功能。

3) 和端侧厂商合作,加强AI软硬件融合

OpenAI推出了macOS电脑版ChatGPT,Windows版本晚些推出。用户用简单的键盘快捷键可以立即向ChatGPT提问,也可以直接在应用程序中截取/讨论屏幕截图。

1.2 谷歌I/O 2024:AI模型、拓展应用、AI硬件全面开花

1) AI模型:推出Gemini 1.5 Flash / 1.5 Pro、Gemma2、Imagen3、VEO等模型

Gemini 1.5 Flash支持100万tokens上下文,Gemini 1.5 Pro支持200万tokens上下文,成本低至0.35美元/百万tokens(从2024年5月30日开始收费,提示超过12.8万个tokens则按照7美元/百万tokens计费)。开源模型Gemma升级,Gemma2具备270亿参数,性能提升两倍,将于6月上线。它可以在Vertex AI的GPU或单个TPU主机上高效运行。在多模态AI模型方面,谷歌发布了文生图模型Imagen 3、文生视频模型Veo、AI音乐生成模型Lyria。Imagen 3与其前身Imagen 2相比,能够更准确地理解自然语言、提示背后的细节和意图,生成视觉丰富、更高质量的图像。Veo对标Sora,可以制作1min+的1080p视频。Veo能够理解“延时摄影”、“风景航拍”等电影术语,并且镜头具有一致和连贯性。

2)AI拓展应用:谷歌 AI助手Project Astra具备摄像视频识别功能;面向Gemini Advanced 订阅者的Gemini Live可以实现流畅的对话功能;针对学习进行了微调的LearnLM新模型。在端侧布局上,Android的内置设备基础模型Gemini Nano也支持多模态,用户可以选择性加入诈骗保护功能;谷歌 TV智能电视操作系统中,借助Gemini模型以便为电影和电视节目生成描述。

3)AI芯片:第六代Trillium TPU新发布,计算性能提高4.7倍,HBM容量和带宽提高一倍,ICI带宽提高一倍,能效比TPU v5e高67%以上,将于2024年底推出。

1.3 微软Build 2024:Copilot对AI应用的多重定义

美国当地时间5月21日,微软Build 2024开发者大会召开。

1) Copilot+PC率先发布,押注Arm架构。在Build 2024前一天,微软率先发布了Copilot+PC,搭载高通骁龙X Elite芯片,将通过Prism的模拟,实现与Windows x86应用程序无缝衔接。

2) Copilot的AI Agent功能不断丰富,用户可以自定义AI Agent。微软推出Team Copilot,用户将能够在Teams、Loop、Planner等会议、协作应用软件中调用Copilot,Team Copilot可以完成会议主持、会议记录等工作,将在2024年晚些推出。Copilot Studio可以有用户自定义Agent。而Copilot Connector、GitHub Copilot Extension可以将Copilot连接到新的数据源和应用程序,增强AI工具在特定领域的应用。

3) AI模型:GPT-4o加持,多模态小模型Phi-3-vision目标端侧。GPT-4o现可在Azure AI Studio中使用,也可以作为API使用。微软开发的42亿参数的AI多模态小语言模型Phi-3-vision,已可在Azure中使用。

4) AI芯片:自研硬件,推出全新的Cobalt 100 Arm-based虚拟机(VMs)预览版。同时在会议上宣布了与AMD和英伟达将加强合作。

我们认为,AI应用将在短期内迎来爆发,大模型厂商将通过价格战来抢占市场。谷歌Gemini 1.5 Flash的价格低至0.00245元/千tokens;5月15日字节跳动推出的豆包Pro 32k推理输入价格定为0.0008元/千tokens,输出价格为0.002元/千tokens;5月21日阿里云也对旗下通义千问的部分模型进行大幅降价,对标GPT-4的模型Qwen-Long的API(输入价格从0.02元/千tokens降至0.0005元/千tokens;输出价格从0.02元/千tokens降至0.002元/千tokens。通用大模型开始进入“以厘计价”的时代,而大模型的训练需要花费大量的算力,价格战最终落地到厂商的资金和技术实力,因此,我们认为大模型赛道将迎来洗牌和整合期。

此外,微软Copilot+PC的推出说明,伴随着AI在端侧布局渗透率的提升,PC处理器架构将带来变革。我们认为,基于Arm的PC处理器对x86架构的替代,可能会使得高通和联发科等Arm处理器厂商蚕食英特尔和AMD的市场份额。

2.市场动态

2024年5月上(5月1日-5月30日),大盘指数中,上证综指上涨0.49%,深证成指下跌0.04%,创业板指下跌1.05%,沪深300上涨0.60%。截至2024年5月15日,申万电子指数为3251.95,较5月1日下跌2.54%,行业涨跌幅在所有一级行业中排序29/31。

2024年5月上,申万电子各子行业中,消费电子板块上涨0.24%,元件板块下跌1.79%,其他电子板块下跌2.65%,电子化学品板块下跌2.78%,光学光电子板块下跌2.91%,半导体板块下跌3.78%。

2024年5月上,申万电子行业385支个股上涨,伊戈尔(27.12%)、宝明科技(23.97%)、久量股份(16.48%)涨幅居前;有83支个股下跌,华微电子(-33.71%)、超华科技(-33.61%)、源杰科技(-15.09%)跌幅居前。

2024年5月上,电子行业上市公司中,龙腾光电、工业富联、传音控股的机构持股比例居前,分别为90.24%、89.29%、85.08%。

风险提示

1、宏观经济恢复不及预期,电子行业下游需求不及预期;

2、贸易摩擦加剧,电子行业供应链进一步受限的风险;

3、若电子行业技术研发和迭代、产品推进不及预期,存在国产替代不及预期的风险;

4、电子行业竞争加剧,使得部分企业盈利能力下滑的风险。


智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏