在人工智能算力竞争的赛道上,马斯克旗下的xAI公司正以惊人的速度推进其基础设施布局。据最新披露,全球首个算力规模达吉瓦级的AI训练集群Colossus 2已进入关键训练阶段,目前有6个前沿模型正在该集群上同步开展训练工作。这座由55万块英伟达GB200 GPU组成的超级计算中心,自今年1月全面投入运营以来,持续刷新着行业对算力极限的认知。
该集群的硬件配置堪称"算力怪兽":其等效算力相当于140万块H100 GPU,采用全液冷散热系统,每小时耗电量与旧金山全市用电峰值持平,相当于同时满足80万户家庭的用电需求。项目从启动到建成仅耗时6个月,总投入超过35亿美元,其中仅GPU采购成本就占据相当比例。如此庞大的能源消耗,与其设定的训练目标直接相关——该集群将承担下一代Grok 5大模型的训练任务,该模型计划实现6万亿参数规模并具备实时视频理解能力。
与传统AI公司依赖云服务提供商的模式不同,xAI选择了一条"垂直整合"的独特路径。通过在全球范围内自建算力基础设施,该公司已部署超过45万块GPU,并计划在2026年第二季度将这一数字提升至90万块。这项总额超300亿美元的硬件投资,使其在AI基础设施领域建立起显著优势。行业分析师指出,这种自建模式虽然需要巨额前期投入,但能确保技术自主性和数据安全性,同时避免受制于第三方供应商的算力分配。
在能源配套方面,Colossus 2正在进行第二阶段扩容。根据规划,其电力装机容量将在本月达到1.5吉瓦,最终目标为2吉瓦。马斯克此前透露,xAI计划在未来五年内部署相当于5000万块H100等级的AI GPU,这一数字超过当前全球主要科技公司GPU保有量的总和。这种激进的扩张策略,反映出xAI在通用人工智能(AGI)领域的雄心——通过构建前所未有的算力优势,加速实现技术突破。



















