智通财经APP获悉,平安证券发布研报称,当前,全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平。大模型需要大算力,大模型算法的迭代升级将为全球和中国AI算力市场的增长提供强劲动力。在当前竞争激烈的宏观背景下,我国国产AI芯片产业链将加快成熟,相关AI芯片和服务器厂商将深度受益。另一方面,此次GTC大会英伟达推出GR00T机器人通用基础模型,在AI持续赋能下机器人产业有望进入加速发展阶段。
相关标的:
AI芯片和服务器厂商:推荐浪潮信息(000977.SZ)、中科曙光(603019.SH)、紫光股份(000938.SZ)、神州数码(000034.SZ)、海光信息(688041.SH)、龙芯中科(688047.SH),建议关注工业富联(601138.SH)、寒武纪(688256.SH)、景嘉微(300474.SZ)、高新发展(000628.SZ)、拓维信息(002261.SZ)、软通动力(301236.SZ)。
机器人产业:建议关注绿的谐波(688017.SH)、中大力德(002896.SZ)、双环传动(002472.SZ)、三花智控(002050.SZ)、贝斯特(300580.SZ)、柯力传感(603662.SH)。
事件:
北京时间3月19日,英伟达在2024年GTC大会上推出全新Blackwell架构芯片平台,同时还展示了公司在加速计算、软件服务、医疗、汽车以及机器人等领域的最新进展。
平安证券主要观点如下:
推出全新Blackwell架构芯片,AI性能飞跃式提升
在2024年GTC大会上,英伟达推出全新Blackwell架构GPU芯片,该芯片基于台积电4nm工艺制造,并采用了双芯片设计,芯片间的互联速度高达10TB/s,总晶体管数量达2080亿个,同时搭配8颗HBM3e内存,内存容量达192GB,带宽达到8TB/s,相比Hopper架构平台提升明显。另外,公司还展示了GB200 超级芯片, 通过900GB/s 超低功耗的NVLink 连接, 将两块Blackwell GPU与一块Grace CPU相连,可提供高达40 petaFLOPS的FP4算力,在标准1750亿参数的GPT-3基准测试中,GB200性能是H100的7倍,提供的训练算力是H100的4倍。
Blackwell平台助力新型DGX系统,性能提升明显且能源效率大幅进步
在加速计算平台方面,英伟达则发布了DGX GB200 NVL72,该服务器产品共搭载了18个GB200加速卡,对应72个Blackwell GPU和36个Grace CPU,通过第五代NVLink互连,同时搭配一体化水冷散热方案,FP8 精度的训练算力高达720 PFLOPs , FP4 精度推理性能为1440PFLOPs。公司表示,与含有相同数量的H100 Tensor Core GPU系统相比,GB200 NVL72在LLM推理工作负载方面的性能提升高达30倍,成本和能耗大幅下降。与此同时,为了实现系统之间的高速连接,公司还推出了两款全新高速网络平台Quantum-X800 InfiniBand平台和Spectrum-X800以太网平台,可实现高达800 GB/s端到端吞吐量。
AI持续赋能人形机器人,机器人通用大模型GR00T亮相
针对机器人领域,英伟达在GTC大会推出了GR00T机器人通用基础模型,该模型可以使人形机器人通过语言、视频和人类演示来理解自然语言并模仿动作,同时还能够进一步提高机器人的协调性和灵活性。除了机器人模型之外,英伟达还介绍了基于NVIDIA Thor SoC平台的机器人新型计算机Jetson Thor,该计算平台内置了Blackwell GPU,AI计算性能达到800TFLOPs,除了可以运行包括GR00T等AI模型之外,还能够执行复杂的任务并使用Transformer引擎处理多个传感器。另外,英伟达ISAAC机器人平台也同步进行了更新升级,开发者可以运用该平台持续提升机器人的学习能力。
风险提示:
1)国内大模型算法发展可能不及预期。当前,虽然国产大模型能力持续升级,但相比OpneAI等全球领先的大模型厂商,国产大模型的追赶进度存在不达预期的风险。
2)AI算力供应链风险上升。美国对华半导体出口管制升级,将倒逼我国国产AI芯片产业链加快成熟。但如果我国国产AI芯片的迭代速度不达预期,将影响我国AI算力的发展。
3)大模型产品的应用落地低于预期。当前,我国国产大模型已经开始在教育、医疗、汽车、办公、工业、智能硬件等B端和C端应用场景持续落地,如果产品的市场拓展不及预期,则我国大模型产品的应用落地将存在低于预期的风险。