智通财经APP获悉,财通证券发布研究报告称,伴随AI场景应用的发展成熟,预训练数据服务是AI产业链走向分工明确的必然产物,目前行业格局重塑期,随着行业进入快速发展期,行业逐渐向多模态、合规化、半自动化演变,科技巨头和专业预训练数据服务商具备更强的研发优势,有望领先享受半自动化标注的红利,形成资源整合和研发技术的壁垒,切分更多市场增量份额。建议关注:海天瑞声(688787.SH)、汇洲智能(002122.SZ)、神州数码(000034.SZ)。
财通证券主要观点如下:
该行认为,数据和高速是AI投资逻辑的核心抓手,伴随AI场景应用的发展成熟,预训练数据服务是AI产业链走向分工明确的必然产物。
纵观AI产业链,上游数据是模型感知世界的起点,中游算法开发是数据应用的工具,下游场景应用拉动算法迭代,监管是贯穿上下游的刚需环节。
本轮ChatGPT浪潮的增长前期,模型使用过往成熟数据导致预训练数据服务需求并未快速增长,是因为预训练数据服务在AI发展过程中不需要?事实恰恰相反,预训练数据服务是AI大模型降本增效、提高算法精度、加速迭代的重要因素。
前期模型训练的核心目的是验证算法可行性,预训练数据多采用历史数据,如ChatGPT3.0的预训练数据为截止到2021年9月的历史数据。因此,前期预训练数据服务需求并未随大模型的算法迭代增长而快速提升,但这并不意味着预训练数据服务是不重要的环节。
伴随着场景应用的落地成为AI大模型新一轮的发展动能,大模型迭代的核心变成算法功能的拓展。AI预训练数据需要承接下游场景采集的全新数据,AI预训练数据需求有望伴随场景应用的落地而快速增长。根据德勤预测,2027年AI预训练数据服务的市场规模有望达到160亿元,2022-2027五年复合增速为28.9%。
智能驾驶有望持续成为弹性最大的下游应用场景,预训练数据需求前置,需求的提升伴随算法迭代和落地车型的量产时间或将呈现周期性收敛。
预训练数据需求受自动驾驶算法迭代、新车型量产落地、新车渗透率等多重因素拉动,智能驾驶有望领先释放预训练数据服务的需求。当前行业将继续受益于L2+向L3技术迭代带来的数据需求放量,2025年之后基础数据需求或将开始相对收敛。2027年迈入L3+向L4的升级迭代,需求有望开启新一轮逐步释放。
强者优势愈发显著,行业格局有望开启重塑步伐,科技巨头和专业数据服务商有望切分更多市场份额。
随着行业进入快速发展期,行业逐渐向多模态、合规化、半自动化演变,科技巨头和专业预训练数据服务商具备更强的研发优势,有望领先享受半自动化标注的红利,形成资源整合和研发技术的壁垒,切分更多市场增量份额。
风险提示:基础数据服务商自动化标注研发进展不及预期;智能驾驶算法更新不及预期;新车型落地渗透率不及预期。