曦望徐冰：专注推理场景，以“芯片+系统+生态”布局引领AI新征程-资讯-沃资讯

曦望徐冰：专注推理场景，以“芯片+系统+生态”布局引领AI新征程

发布时间：2026-01-29 21:57 来源：天脉网作者：赵云飞

在近日举办的曦望首届Sunrise GPU Summit上，一款专为AI推理场景设计的新一代GPU芯片——启望S3正式登场。与此同时，曦望科技还对外公布了围绕推理场景打造的算力产品体系，以及共建推理云生态的宏伟计划。这一系列动作标志着，AI产业正加速从“训练驱动”向“推理驱动”转型，而曦望科技正试图在这场变革中占据核心地位。

曦望科技董事长徐冰在现场演讲中指出，随着大模型技术的日益成熟，AI的应用场景正迅速扩展，推理需求随之激增。据德勤最新报告预测，到2026年，推理算力在整体AI算力中的占比将达到66%，超越训练算力成为主流。这一结构性变化，不仅要求算力提供商具备更强的长期交付能力和系统稳定性，还对其成本控制提出了更高要求。

徐冰强调，曦望科技并非一家单纯的芯片销售商，而是致力于构建“芯片+系统+生态”的全方位布局。通过整合芯片设计、系统优化和生态合作，曦望科技希望将推理算力打造成为可规模化、可持续的基础设施，为AI产业的快速发展提供坚实支撑。

曦望科技的前身是商汤科技的大芯片部门，自2020年独立运营以来，便深耕AI推理领域。凭借与商汤科技及国内早期AI应用项目的紧密合作，曦望科技积累了丰富的实战经验，从人脸识别到自动驾驶，再到如今的大模型和多模态AI，完整经历了AI技术的各个发展阶段。这种独特的背景，使得曦望科技能够更精准地把握市场需求，设计出更符合实际应用场景的芯片产品。

面对2025年全球大模型token消耗量激增100倍的挑战，曦望科技团队夜以继日地投入研发，终于将打磨多年的技术和产品推向市场。这支由来自英伟达、AMD、昆仑芯、商汤等顶尖企业精英组成的团队，平均拥有15年行业经验，是曦望科技最宝贵的财富。

在商业模式上，曦望科技采取了差异化的策略。不同于传统芯片厂商，曦望科技不仅提供推理GPU卡、一体化服务器等硬件产品，还致力于成为现有算力系统的推理分流和成本优化层。通过与商汤、范式等AI巨头及各类算力厂商的深度合作，曦望科技希望构建一个开放、共赢的推理云生态。

徐冰透露，曦望科技已累计投入20亿元用于研发，成功量产了S1和S2两款芯片。其中，S1和S2的成功不仅证明了曦望科技的技术实力和市场认可度，更为其后续产品的研发奠定了坚实基础。此次发布的启望S3，以及未来S4和S5的规划路径，展示了曦望科技在推理芯片领域的持续创新能力和远见卓识。

徐冰表示，曦望科技的目标是将推理成本降低90%，同时提供稳定可靠的服务。这一目标若得以实现，将极大地推动AI技术的普及和应用，助力全行业实现盈利增收。为此，曦望科技正与整个产业携手共进，努力将中国的推理成本拉低至“百万token一分钱”的新水平。

在徐冰看来，推理时代的到来，为算力提供商带来了前所未有的机遇。曦望科技正致力于成为那个让算力变得便宜、稳定、到处可用的核心底座。这个底座一头连接着芯片架构、制造工艺和能耗模型等底层技术，另一头则与国家对AI基础设施和能源效率的长期规划紧密相连。中间部分，则是云厂商、算力中心、AI公司以及千行百业的广泛合作，共同推动AI技术的快速发展和应用。

更多>同类内容