智通财经APP获悉,国泰君安证券发布研报称,最新的 GPT-4o 能够与用户实时沟通、理解语气,在教育、情感陪伴、虚拟人等赛道具备较强落地可能性,相关布局公司产品效果有望提升。AI 应用门槛持续降低,语音及图像交流的使用体验进一步提升,继续看好 C 端应用场景拓展,如下场景可能受益:1)教育,受益标的世纪天鸿、皖新传媒、南方传媒、鸿合科技;2)情感陪伴与语音赛道,受益标的昆仑万维、盛天网络;3)虚拟人与游戏,推荐恺英网络、吉比特、三七互娱、完美世界,受益标的巨人网络、掌趣科技、捷成股份;4)硬件端产品合作。
5 月 14 日,OpenAI 发布最新旗舰大模型 GPT-4o。GPT-4o 免费向所有人提供 GPT-4 级别的 AI,应对低成本开源模型竞争态势。GPT-4o将对所有用户免费开放当前Plus会员版的全部功能,包括视觉、联网、记忆、数据分析、执行代码、GPT Store 等。
GPT-4o 打通多模态,可实时语音对话。根据官方演示效果,GPT-4o能实现 1)与演示者即时交流、2)理解和表达语言情绪、3)根据摄像头输入实时互动解答问题;相比下,之前的 GPT 只能进行单轮次的语言对话、单张照片输入,也无法理解和表达语言情绪,语音沟通的实现是通过“语音转文字”、“文字理解(GPT4)”、“文字转语音”的方式进行文本信息的处理。此次 GPT-4o 实现的“无缝交流”说明其能够同时理解文本、图像、音频等,并能将其任何组合作为输入或输出。GPT-4o 所有输入和输出由同一个神经网络处理,这使它能压缩响应时间至 320 毫秒并接收语气、停顿等非语言信息,实现几乎无延迟的实时对话。
期待端侧应用场景与开发端应用。随着多模态打通,GPT-4o 响应速度更快、成本更低、人机交互更顺畅,能够更好的在手机、电脑等端侧进行 AI 交互,可期待相关布局推进;同时,GPT-4o 的 API 被放出,可以部署到各种下游应用程序中,相较 GPT-4 Turbo,推理速度提升2 倍,消息上限提高五倍,价格降低 50%。
风险提示:GPT-4o 效果及推进不及预期;国内大模型发展进度不及预期。