智通财经APP获悉,广发证券发布研报称,以o1为代表的AI大模型性能如高阶推理能力持续提升,有望推动AI大模型由效率工具向智力替代方向转变。但较高的使用成本限制了o1模型在大规模商用中的适用性。随着o1大模型后续的不断优化,成本有望降低,价格存在下探可能性。相比GPT-4o的实时响应,不管简单问题还是复杂问题,o1大模型在回答前均需要进行精细化思考,速度较慢。模态方面,目前o1仅支持纯文本模式,尚不具备多模态能力。伴随技术进步,AI大模型未来仍有较大潜力可待挖掘。
OpenAI o1的发布有望推动AI大模型由效率工具向智力替代方向转变。广发证券在2023年6月发布的深度报告《计算机行业:多模态大模型方向确定,从通用到垂直场景智能化升级的统一和差异》中曾提到“程序开发人员在人工智能编码助手GitHub Copilot的帮助下,减少了55%的代码开发时间,效率提升效果显著”。经过一年多时间的发展,以o1为代表的AI大模型性能持续提升,有望在程序开发、科学研究等智力工作上实现更多人力替代。
更长的强化学习时间,更大的算力消耗是o1大模型性能提升的关键。OpenAI采用了大规模强化学习的方式来打造o1大模型高效的思维链路能力。在研发过程中,OpenAI发现o1大模型的性能与强化学习的训练时长呈正相关关系,回答问题的效果与推理时长呈正相关关系。o1大模型在回答高阶的科学问题时推理的时间较长,而回答的效果较好,反映了OpenAI增加了强化学习的时长所达到的效果。o1开拓了AI大模型性能提升新的技术方向,为实现更高水平的逻辑思维能力,各AI模型公司在训练和推理阶段或增加强化学习时长,采用更大规模的AI算力,有望推动AI芯片、网络设备等硬件基础设施的增长。
较高的使用成本限制了o1模型在大规模商用中的适用性。首先,目前o1模型的使用权限和次数受到严格控制,只有高级用户和特定开发者账户才能访问,并且调用频率有限,不足以支撑大规模应用。其次,o1模型在回答生成过程中消耗大量tokens,每次推理消耗的算力成本较高,进一步增加了商用成本。因此,在当前的定价和使用限制下,o1模型并不适合大规模商用场景。随着o1大模型后续的不断优化,成本有望降低,价格存在下探可能性。
实测效果较强,但仍有较大潜力可待挖掘。通过测试,广发证券总结,o1大模型展现出了强大的推理能力和先进的思维链技术,在某些科学知识领域的推理能力超越了此前版本,模型的“拟人化”表现也有所提升。然而,根据OpenAI官方文档,o1-preview在某些自然语言任务中并不是首选。此外,相比GPT-4o的实时响应,不管简单问题还是复杂问题,o1大模型在回答前均需要进行精细化思考,速度较慢。模态方面,目前o1仅支持纯文本模式,尚不具备多模态能力。因此,o1大模型虽然表现较强,高阶推理能力显著提升,但在某些方面仍存在改进空间。伴随技术进步,AI大模型未来仍有较大潜力可待挖掘。
风险提示。研发投入与技术更新的持续压力;推理成本与算力需求上升阻碍下游应用商业化落地风险;AI生成内容存在知识版权纠纷风险。