本文源自微信公众号“DeepTech深科技”。
基于在AI和GPU上的成绩,英伟达(NVDA.US)CEO黄仁勋多年以来已被戏称为“AI 教主”。
今年,他又将《哈佛商业评论》百大最佳 CEO(唯一华人 CEO)、IEEE 创始者奖章(IEEE FOUNDERS MEDAL)收入囊中,理由是其极富远见地领导了 NVIDIA 公司,同时推动了基于 GPU 加速的 AI 人工智能行业的发展。
(来源:英伟达)
12 月 18 日,这位 “教主” 来到了中国,在苏州 GTC China 大会上发表演讲,带来了其最新的自动驾驶芯片 Orin 以及升级的中国 “朋友圈”,继续传播其“GPU,THE MORE YOU BUY,THE MORE YOU SAVE” 的宗旨。
下一代自动驾驶芯片——Orin
从模拟世界的图像渲染技术、到主打科学计算的高性能计算,再到 AI 计算,英伟达更新了一系列更好的 GPU
系统产品和工具,这三大方向上的几大重要更新包括:
1、图像渲染上,NVIDIA RTX 支持世界顶级的渲染平台包括 Autodesk Arnold、Chaos Group V-Ray 和 Blender Cycles 等;曾渲染了众所周知的《战狼 2》、《哪吒》和《流浪地球》的瑞云云渲染平台将配备 NVIDIA RTX GPU,将其速度提升 12 倍,而价格则低 7 倍。
2、高性能计算上,发布 Parabricks 基因组分析工具包,可用于发现基因变异,并能产生与行业标准 GATK 最佳实践流程一样的结果。Parabricks 提供 DeepVariant 工具,利用深度学习技术进行基因变异检测,它还能实现 30-50 倍的加速效果。目前,华大基因已经采用 Parabricks。
(来源:英伟达)
3、AI 计算上,发布 NVIDIA TensorRT7。TensorRT7 支持各种类型的 RNN、Transformer 和 CNN。这是一个高性能深度学习推理平台。它包含深度学习推理优化器和提供低延迟和高通量的深度学习推理应用程序的运行时。TensorRT7 可以为开发者设计的大量 RNN 配置自动生成代码,逐点融合 LSTM 单元,甚至可跨多个时间步长进行融合;并且尽可能做自动低精度推理;以及新的自动驾驶、机器人平台——NVIDIA DRIVE AGX ORIN 软件定义的自动驾驶汽车平台。
(来源:英伟达)
其中,Orin 平台内置全新 OrinSoC 芯片。该芯片由 170 亿个晶体管组成,由英伟达团队耗时四年打造。Orin SoC 集成了英伟达新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,每秒可运行 200 万亿次计算,几乎是英伟达上一代 Xavier 芯片性能的 7 倍。
Orin 可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了 ISO 26262 ASIL-D 等系统安全标准。
据介绍,DRIVE AGX Orin 作为一个软件定义平台,将能够覆盖从 L2 级到 L5 级完全自动驾驶汽车开发的兼容架构平台,助力 OEM 开发大型复杂的软件产品系列。由于 Orin 和 Xavier 均可通过开放的 CUDA、TensorRT API 及各类库进行编程,因此开发者能够在一次性投资后使用跨多代的产品。
黄仁勋表示:“打造安全的自动驾驶汽车,也许是当今社会所面临的最大计算挑战。实现自动驾驶汽车所需的投入呈指数级增长,面对复杂的开发任务,像 Orin 这样的可扩展、可编程、软件定义的 AI 平台不可或缺。”
(来源:英伟达)
NVIDIA DRIVE AGX Orin 系列将包含一系列基于单一架构的配置,并将于 2022 年开始投产。
与此同时,滴滴也宣布将使用 Nvidia 技术开发自动驾驶:将在数据中心使用 NVIDIA®GPU 训练机器学习算法,采用 NVIDIA DRIVE™ 为其 L4 级自动驾驶汽车提供推理能力,并即将在上海测试车队。
英伟达中国 AI 朋友圈大升级
整场发布会近 10 项重要产品更新令人目不暇接的同时,贯穿这些重要产品和技术发布的另一条支线是,英伟达的中国朋友圈正在以前所未有的速度扩张,与中国公司在
AI 上的合作又得到进一步扩大,尤其将 BAT 一举收入囊中。
有趣的是,在今天的发布会上,黄仁勋在更新中国朋友圈时,还在某个环节将百度错说成了“阿里巴巴”。
英伟达和 BAT 今日宣布的合作进展中,和腾讯(00700)在云游戏上的合作颇受关注。
自 2009 年开始起步,英伟达、索尼等公司在 2014-2015 年相继推出云游戏平台。目前在国外厂商中,微软、谷歌、英伟达、索尼四大巨头具备竞争优势,一方面,这些公司正在加速升级技术,以提供更好的云游戏服务和体验,另一方面则是结盟产业链上下游推动产业生态、市场成型。
而在英伟达 GTC 大会上,CEO 黄仁勋宣布与腾讯合作,在中国将电脑游戏引入云端,英伟达显卡将为腾讯的 START 云游戏平台提供支持。腾讯计划扩展该平台,供百万玩家使用,提供与主机一致的游戏体验,即使性能不足的终端也能享受到无损的体验。
(来源:英伟达)
此外,英伟达和腾讯游戏还宣布成立一个游戏联合创新实验室。双方将共同探索 AI 在游戏、游戏引擎优化和新光照技术(包括光线追踪和光线烘焙)中的新应用。
腾讯游戏高级副总裁马晓轶表示:“NVIDIA 打造了全球最强大的 GPU,是 GPU 领域的领导者,又具有云解决方案方面的经验,这两大优势能够帮助我们将 START 平台扩展到数百万玩家。今天对于我们公司来说是一个新的契机,我们将进一步扩大我们在游戏市场的疆域。”
今年初,英伟达就宣布与日本 SoftBank 和韩国 LG U + 公司合作开发云游戏解决方案。此外,英伟达还在北美和欧洲部分市场提供 GeForce NOW™ 云游戏服务,为全球的游戏玩家提供最佳的专属云端电脑游戏体验。
在和百度(BIDU.US)的合作上,英伟达宣布百度推荐系统将采用英伟达 AI ,100 多个推荐模型将被应用在百度的众多应用中,这些模型将会每周更新,学习用户的潜在兴趣,新的条目和特征将被持续更新。英伟达表示百度的 AIBox 系统是 wide and deep 结构,且采用 GPU 训练的成本只有 CPU 的十分之一。而刚刚过去的双十一,阿里巴巴的推荐系统也采用了英伟达的 AI 技术,每秒几十亿的推荐请求,CPU 只有 3QPS,而英伟达的 GPU 可达 780 QPS。
英伟达 26 年历史,GPU+CUDA 搭起的 AI 算力帝国
在今天的演讲中,黄仁勋特别提到,英伟达已经成立 26 年。
在这个特殊时间点,他用一句话总结了 26 年时间所做的事情——用正确的工具去加速计算。
“摩尔定律终点临近,人类需要另一种计算方法,我们要用对的工具解决问题”。
在黄仁勋看来,加速计算已经有了一个很好的开始,即革命性的处理器 GPU 诞生。然而,这仅仅是个开始。真正的加速计算挑战的是 GPU 背后的全栈工程能力。
“为了获得加速计算的现实好处,你必须重新设计和优化从处理器到设计再到算法,把系统软件变成工具、甚至应用程序作为一个生态系统一起工作。英伟达的一个重要经验是,重构软件让 GPU 加速计算的规模和性能,都远超出了处理器本身最初的状态”。
这个关键的软件生态,就是 CUDA。CUDA 的诞生就是为了让 GPU 能够有可用的编程环境,使得开发人员可以用程序控制 GPU 的硬件进行并行计算。仅在 2018 年,英伟达发布了 500 多个 SDK 和库,英伟达不断改进软件栈,提高用户已有的 GPU 的性能。CUDA 帮助英伟达成为 AI 产业最大受益者之一,GPU 生态效应也使得英伟达暂无后顾之忧。近年来,国内外的 AI 芯片公司在产品发布会上多拿英伟达及其产品作为对标的原因,但宣传归宣传,目前在商业市场上,GPU+CUDA 构建出的庞大帝国,还无新进者可以撬动。
(编辑:宇硕)