在今日举办的NVIDIA GTC 2025年度大会(GTC DC)上,英伟达宣布推出下一代数据处理单元(DPU)——NVIDIA BlueField-4,其技术规格引发行业高度关注。这款基于Rubin架构的芯片计划于2026年正式上市,将作为NVIDIA Vera Rubin平台的核心组件,预计在2026年初进入早期商用阶段。
BlueField-4的核心突破在于其硬件集成能力。该芯片搭载了多达64个Arm架构核心的"Grace"CPU,这一设计延续了英伟达在Grace架构上的技术积累——此前该架构已应用于基于Arm Neoverse V2的处理器及GB10平台,后者更创新性地集成了两种不同类型Arm Cortex核心。在晶体管规模方面,BlueField-4集成了高达1260亿个晶体管,较前代产品实现数量级提升。
网络性能是这款DPU的另一大亮点。通过集成NVIDIA ConnectX-9网络技术,BlueField-4将全面支持800G高速网络连接,满足AI计算集群对超低延迟、超高带宽的严苛需求。尽管完整规格尚未公布,但业界普遍预期其接口标准将至少达到PCIe Gen6水平,这与Rubin架构产品线的技术演进方向高度契合。
在应用场景层面,英伟达CEO黄仁勋特别强调了KV缓存(Key-Value Cache)处理能力的提升。他指出,新一代网卡(NIC)的核心优化方向之一是加速系统级KV缓存性能,这在恢复大语言模型(LLM)历史对话等场景中具有关键作用。虽然Rubin CPX平台更侧重预填充阶段的性能优化,但KV缓存的强化将显著提升AI推理的连续性和效率。
从产业影响来看,BlueField-4的推出将进一步巩固英伟达在AI基础设施领域的生态优势。当前全球AI集群建设持续投入大量资本支出(CapEx),且多数基于英伟达GPU架构,这款集成64核Arm CPU的DPU虽非市场首创,但凭借英伟达的技术整合能力和生态协同效应,仍将对数据中心架构产生深远影响。通过将更多功能集成至单一芯片,英伟达正持续推动AI工厂运行效率的革新。




















