昇腾AI开发者峰会2026北京启幕:携手开发者,共绘Agentic AI时代新蓝图

   发布时间:2026-05-24 06:02 作者:赵磊

在近日举办的昇腾AI开发者峰会上,全球开发者齐聚一堂,共同探讨Agentic AI时代的技术创新与生态建设。本次峰会以“一起昇腾 共绽光芒”为主题,重点展示了昇腾在超节点架构、软件易用性提升及开发者生态建设方面的最新成果。华为公司Fellow、半导体首席科学家廖恒在主题演讲中指出,随着Agentic AI的快速发展,AI芯片的算力、内存带宽、内存容量和互联IO带宽四大核心指标在不同场景下的优先级呈现差异化特征,其中互联能力已成为决定超节点性能的关键因素。

针对Agent时代对推理时延的严苛要求,廖恒提出将EP通信限制在Scale Up域内完成的解决方案。他解释道,EP通信具有All-to-All的多对多细粒度特性,单数据包仅7KB至14KB,随着专家数量增加,数据包交互频次呈平方级增长,传统网络架构难以满足低时延需求。在KV Cache管理方面,华为通过创新设计搭载UB端口的SSU单元,构建了NPU直接命中SSU的架构,使带宽提升至少一个数量级,同时将KVCache命中率推高至95%以上,显著降低了Prefill成本。

在软件生态建设领域,昇腾计算产品部部长周斌详细介绍了CANN全面开源开放的战略布局。作为昇腾软件生态的核心,CANN已完成分层解耦,开放全层级接口,支持算子与通信库独立升级,目前已开源50余个源码仓。针对不同开发者需求,昇腾提供全栈支持:Ascend C和CATLASS模板库满足性能优化需求,TileLang和Triton生态支持快速创新,PyAsc等Python工具链则大幅降低了开发门槛。特别值得一提的是,CANNBot算子智能体的引入使单个Vector算子开发时间缩短至3小时,全流程效率提升5倍以上。

在兼容性方面,昇腾通过多项创新实现了与主流开源生态的无缝对接。算子编程层面,Triton和TileLang接口兼容度达100%,性能达到Ascend C的60%-90%,开发周期缩短至一周。AI框架支持上,昇腾与PyTorch生态实现2300多个API对齐,图模式加速支持40余个模型,分布式加速使20多个主流大模型实现FSDP2开箱即用。强化学习领域,与verl社区的合作使训练效率提升2倍以上,累计合入超万行代码。

Mind系列软件的全面升级成为本次峰会的另一亮点。MindSpore通过组件化解耦提升了超节点场景下的图模式和分布式能力;MindSpeed采用架构革新设计,灵活适配开源社区;MindIE系列软件栈的升级使推理性能更稳定高效;MindStudio的开源开放则通过搭载智能助手,显著提升了开发调试效率。这些升级共同构建了从推理引擎到上层服务的完整技术栈,为开发者提供了全流程高效开发体验。

为进一步壮大开发者生态,昇腾宣布全面升级开发者使能计划。该计划从社区体验、开发工具、激励权益三个维度发力:社区层面实现一键自动部署,2分钟即可跑通首个Demo,并提供1000+昇腾卡和每人100卡时的免费算力;开发工具方面,通过Agent工作流将数千名专家经验转化为skills,使复杂任务开发周期大幅压缩;激励体系则设立首批创新基金,投放10000卡算力资源,重点支持算子、加速库等领域的创新探索。峰会现场还颁发了“昇腾开源贡献杰出个人奖”和“昇腾开源合作杰出团队奖”,表彰在技术创新和生态建设中表现突出的开发者及团队。

 
 
更多>同类内容
全站最新
热门内容