阿里云全栈Agent化升级:以芯片云模型重构体系,押注AI未来新机遇

   发布时间:2026-05-21 15:14 作者:刘敏

阿里云在近期举办的峰会上宣布完成了一项重大技术升级,实现了从“芯片-云-模型-推理”的全栈Agent化转型。这一举措标志着阿里云正加速向AI驱动的云服务模式转变,其核心目标是构建中国最大的AI基础设施平台。此次升级同步推出了全新AI产品官网“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。

阿里云资深副总裁刘伟光将这一转型比喻为“建设AI工厂”,其中芯片作为原材料,云平台充当生产车间,模型扮演机器角色,推理平台则构成流水线,最终产出以Token为载体的智能服务。这一生产逻辑的转变,意味着阿里云正在从传统“人使用云”的体系,向“Agent消费Token”的新模式全面重构。过去五个月,阿里云MaaS(模型即服务)收入增长达15倍,成为这一战略转型的初步成果。

在芯片领域,阿里云此次发布了新一代训推一体AI芯片真武M890,并首次公开未来两年芯片路线图。该芯片配备144GB显存,片间互联带宽达800GB/s,性能较上一代提升3倍。通过自研ICN Switch互联芯片,128张AI芯片可组成单台超节点服务器,P2P时延控制在150纳秒以内。更值得关注的是,真武系列芯片已实现规模化应用,累计出货56万片,覆盖电信、汽车、金融等20多个行业的400余家客户。

阿里云的技术路线与谷歌TPU与Gemini模型的深度绑定策略形成呼应。刘伟光强调,未来竞争的关键在于“让每块芯片产生更多高质量Token”。通过整合倚天CPU、磐脉智能网卡、镇岳存储主控芯片,阿里云已形成覆盖算力、网络、存储的完整芯片版图。这种垂直整合能力,在推理需求指数级增长的背景下,成为控制Token边际成本的核心优势。

云平台的重构同样具有颠覆性。传统云服务设计面向人类用户,而Agent对云的需求呈现“无规律弹性、短生命周期、瞬时起量即走”的特征。阿里云CTO李飞飞指出,单个Agent完成任务后沙箱即销毁,下一请求可能数毫秒或数小时后到达。为适应这种工作模式,阿里云实施了三项关键改造:将云产品封装为标准化Agent接口;构建包含轻量沙箱、多Agent协同、跨任务记忆的专属运行环境;将调度逻辑从“资源调度”转向“任务调度”。

这些改造已产生显著效果。某AI应用上线后,可自动在后台开通虚拟机、数据库实例等云资源,单日自动开通量相当于过去人工操作两周的工作量。刘伟光透露,Token消耗与GPU用量呈正相关,而每卡GPU增长可带动等量CPU增长,这意味着AI收入正在拉动传统云业务增长,前提是云平台能承载Agent的工作负载。因此,阿里云选择彻底重构交互方式、调度逻辑、计费模型和产品形态,而非简单叠加AI功能。

模型能力的进化是另一重点。Qwen3.7-Max在Arena全球盲测中位列国产模型首位,其核心突破在于从“对话能力”转向“执行能力”。在未接触过的真武M890芯片上,该模型仅凭任务说明,自主完成生产级AI计算内核的编写与调优,性能较官方版本提升10倍,全程无需人工干预。这种长程自主执行能力,需要百炼平台在GPU利用率优化、上下文缓存、吞吐弹性调度等方面提供支撑。目前,百炼平台已接入智谱GLM-5.1、MiniMax M2.7等第三方模型,形成多模型组合服务能力。

这场转型对阿里云的组织架构产生深远影响。销售团队从与IT部门对接转向直接服务业务部门甚至CEO,考核指标从调用量转向“高质量Token”、核心业务系统接入数量和Agent任务闭环效率。刘伟光坦言,转型难度超出预期,但AI带来的市场机会可能是传统云业务的十倍甚至百倍。这种判断驱动阿里云以近乎创业公司的姿态,对技术体系、客户关系和销售模式进行全面重构。

 
 
更多>同类内容
全站最新
热门内容