中国移动自主研发的九天35B通用大模型即将在第九届数字中国建设峰会上揭开面纱。作为国内通信行业的重要创新成果,该模型在发布前已通过关键技术验证——摩尔线程宣布其旗舰级AI训推一体全功能GPU MTT S5000成功完成对九天35B的全流程适配与推理测试,标志着国产大模型与硬件生态的协同发展迈出重要一步。
此次技术突破的核心在于摩尔线程自研的MUSA软件栈体系。通过整合SGLang-MUSA高性能推理引擎,研发团队实现了从模型加载到输出响应的全链路深度优化。针对大模型特有的注意力机制与长序列处理需求,团队基于MUSA C开发框架、muDNN计算库及MATE开源算子库进行定制化调优,确保九天35B在复杂推理场景下的稳定性与效率。
作为支撑平台的关键硬件,MTT S5000采用第四代MUSA"平湖"架构设计,单卡AI稠密算力达1000 TFLOPS,配备80GB高速显存与1.6TB/s带宽,可同时支持FP8至FP64全精度计算。这种架构特性恰好匹配九天35B在长文本解析与高并发响应方面的核心需求,在标准测试环境中,该GPU卡已能稳定承载模型的高频推理请求。
技术团队透露,适配过程中重点攻克了算子融合、内存优化等关键技术。通过将模型特有的计算模式与MUSA架构的并行计算能力相结合,不仅提升了单卡处理效率,还为后续多卡扩展预留了技术接口。摩尔线程相关负责人表示,此次验证成果将为大模型在金融、政务等领域的规模化部署提供硬件支撑参考。




















