在近期举办的 Google Cloud Next 大会上,谷歌云服务部门 Google Cloud 宣布推出一款全新的 A5X 裸金属实例,该实例由 NVIDIA 的 Vera Rubin 机架级系统提供强大动力支持。
裸金属服务器,简单来说就是云上的物理服务器,它具有资源独立的特点,不存在虚拟化开销,也不会出现性能损失,能够为用户提供更稳定、高效的计算环境。此次推出的 A5X 裸金属实例,在硬件配置上堪称豪华。
它采用了英伟达的 ConnectX - 9 SuperNIC 以及谷歌最新的 Virgo Network 超大规模扩展型 AI 数据中心架构。这种强大的硬件组合,使得 A5X 在集群扩展能力上表现卓越。在单站点集群中,它能够扩展至多达 8 万个 Rubin GPU;而在多站点集群中,更是可以支持多达 96 万个 GPU。如此强大的扩展能力,能够充分满足客户运行超大规模 AI 工作负载的需求。
Google Cloud AI 和计算基础设施副总裁兼总经理 Mark Lohmeyer 表达了对 AI 未来发展的看法。他指出,在 Google Cloud 看来,未来十年 AI 的发展走向,将取决于客户能否在真正集成且经过 AI 优化的基础设施堆栈上,运行那些对性能要求极高的工作负载。
他还强调,此次 Google Cloud 与 NVIDIA 的合作意义重大。通过将 Google Cloud 可扩展的基础设施和托管 AI 服务,与 NVIDIA 先进的平台、系统和软件相结合,能够为客户带来极大的灵活性。无论是训练前沿模型、开放模型,还是部署智能体和物理 AI 工作负载等各种场景,客户都可以根据自身需求进行选择,同时还能在性能、成本和可持续性方面实现优化。




















