英伟达正准备从现有的 Blackwell 芯片迈向更为先进的 Blackwell Ultra。Blackwell Ultra 预计在今年晚些时候发布,它将带来显著的性能提升。据悉,Blackwell Ultra 将是首个拥有 288GB HBM3e 的 GPU,内存带宽相比前代有大幅提升,这将使得数据处理速度更快,为 AI 应用提供更强大的支持
同时,英伟达还推出了与 Blackwell Ultra 配套的 GB300 NVL72 机架级解决方案和 NVIDIA HGX B300 NVL16 系统。GB300 NVL72 机架级解决方案集成了 72 个 Blackwell Ultra GPU 和 36 个基于 Arm Neoverse 架构的 NVIDIA Grace CPU,形成一个庞大的单体 GPU,专为测试时的扩展推理而打造。通过 GB300 NVL72,AI 模型可以利用平台增强的算力,探索不同的解决方案,并将复杂请求拆解为多个步骤,从而实现更高质量的响应。预计 Blackwell Ultra 将比前代产品提供 1.5 倍的 AI 性能,而与使用 NVIDIA Hopper 构建的工厂相比,Blackwell 的 AI 工厂收入机会增加了 50 倍。这一系列升级将进一步巩固英伟达在 AI 推理市场的地位。
Rubin 平台:2026 年的重磅登场
在发布会上,黄仁勋还介绍了正在研发的 AI 超级芯片平台 Rubin,该平台预计在 2026 年下半年推出。Rubin 平台以著名天文学家维拉・鲁宾(Vera Rubin)的名字命名,这延续了英伟达以杰出科学家命名芯片架构的传统。
Rubin 平台拥有全新的 CPU 和网络架构,性能将是 Hopper 的两倍,且内存更大。Rubin 平台由 Rubin GPU 和 Vera CPU 组成,其中 Vera CPU 拥有 88 个定制 Arm 核心、176 个线程。据介绍,Vera 的新架构设计将会比 Grace CPU 快两倍。在机架级解决方案方面,英伟达展示了 Vera Rubin NVL144 和 Rubin Ultra NVL576。Vera Rubin NVL144 的 FP4 推理算力可达到 3.6EFLOPS,FP8 训练算力可达到 1.2EFLOPS,是新发布的 GB300 NVL72 的 3.3 倍。Rubin Ultra NVL576 的 FP4 峰值推理算力高达 15EFLOPS,FP8 训练算力达到 5EFLOPS,是 GB300 NVL72 的 14 倍。强大的性能将为各类 AI 应用,如大规模语言模型训练、复杂的图像识别和处理等,提供前所未有的计算能力。
未来展望:Feynman 架构
除了已经明确发布时间的 Blackwell Ultra 和 Rubin 平台,英伟达的路线图中还透露了更远未来的布局。在 Rubin 之后的下一代芯片架构被命名为 Feynman,预计将于 2028 年问世。该架构以著名理论物理学家 Richard Feynman 命名。虽然目前关于 Feynman 架构的具体细节还未公布,但从英伟达一贯的技术发展节奏来看,Feynman 架构有望带来又一次的技术飞跃,为 AI 领域的发展注入新的活力。
技术推动与行业影响
英伟达在 AI 芯片领域的持续创新,不仅是自身技术实力的体现,也将对整个 AI 行业产生深远影响。随着这些新芯片的逐步推出,AI 计算能力将得到极大提升,这将加速 AI 技术在各个领域的应用和落地。无论是医疗领域的疾病诊断与药物研发、交通领域的自动驾驶技术发展,还是金融领域的风险预测与智能投顾等,都将受益于英伟达强大的 AI 芯片技术。
同时,英伟达的技术进步也将促使竞争对手加大研发投入,推动整个行业的技术进步。在未来的几年里,我们有望看到 AI 技术在更强大的硬件支持下,实现更多的突破和创新,为人类社会的发展带来更多的可能性。
总之,英伟达 GTC 2025 大会发布的 AI 芯片最新路线图,让我们看到了 AI 芯片领域的光明未来。随着 Blackwell Ultra、Rubin 以及未来 Feynman 等芯片架构的逐步推出,英伟达将继续引领 AI 芯片技术的发展潮流,为全球 AI 产业的繁荣贡献力量。让我们拭目以待,见证这些强大芯片在未来 AI 世界中的精彩表现。
发表评论