在近日举办的曦望首届Sunrise GPU Summit上,一款专为AI推理场景设计的新一代GPU芯片——启望S3正式登场。与此同时,曦望科技还对外公布了围绕推理场景打造的算力产品体系,以及共建推理云生态的宏伟计划。这一系列动作标志着,AI产业正加速从“训练驱动”向“推理驱动”转型,而曦望科技正试图在这场变革中占据核心地位。
曦望科技董事长徐冰在现场演讲中指出,随着大模型技术的日益成熟,AI的应用场景正迅速扩展,推理需求随之激增。据德勤最新报告预测,到2026年,推理算力在整体AI算力中的占比将达到66%,超越训练算力成为主流。这一结构性变化,不仅要求算力提供商具备更强的长期交付能力和系统稳定性,还对其成本控制提出了更高要求。
徐冰强调,曦望科技并非一家单纯的芯片销售商,而是致力于构建“芯片+系统+生态”的全方位布局。通过整合芯片设计、系统优化和生态合作,曦望科技希望将推理算力打造成为可规模化、可持续的基础设施,为AI产业的快速发展提供坚实支撑。
曦望科技的前身是商汤科技的大芯片部门,自2020年独立运营以来,便深耕AI推理领域。凭借与商汤科技及国内早期AI应用项目的紧密合作,曦望科技积累了丰富的实战经验,从人脸识别到自动驾驶,再到如今的大模型和多模态AI,完整经历了AI技术的各个发展阶段。这种独特的背景,使得曦望科技能够更精准地把握市场需求,设计出更符合实际应用场景的芯片产品。
面对2025年全球大模型token消耗量激增100倍的挑战,曦望科技团队夜以继日地投入研发,终于将打磨多年的技术和产品推向市场。这支由来自英伟达、AMD、昆仑芯、商汤等顶尖企业精英组成的团队,平均拥有15年行业经验,是曦望科技最宝贵的财富。
在商业模式上,曦望科技采取了差异化的策略。不同于传统芯片厂商,曦望科技不仅提供推理GPU卡、一体化服务器等硬件产品,还致力于成为现有算力系统的推理分流和成本优化层。通过与商汤、范式等AI巨头及各类算力厂商的深度合作,曦望科技希望构建一个开放、共赢的推理云生态。
徐冰透露,曦望科技已累计投入20亿元用于研发,成功量产了S1和S2两款芯片。其中,S1和S2的成功不仅证明了曦望科技的技术实力和市场认可度,更为其后续产品的研发奠定了坚实基础。此次发布的启望S3,以及未来S4和S5的规划路径,展示了曦望科技在推理芯片领域的持续创新能力和远见卓识。
徐冰表示,曦望科技的目标是将推理成本降低90%,同时提供稳定可靠的服务。这一目标若得以实现,将极大地推动AI技术的普及和应用,助力全行业实现盈利增收。为此,曦望科技正与整个产业携手共进,努力将中国的推理成本拉低至“百万token一分钱”的新水平。
在徐冰看来,推理时代的到来,为算力提供商带来了前所未有的机遇。曦望科技正致力于成为那个让算力变得便宜、稳定、到处可用的核心底座。这个底座一头连接着芯片架构、制造工艺和能耗模型等底层技术,另一头则与国家对AI基础设施和能源效率的长期规划紧密相连。中间部分,则是云厂商、算力中心、AI公司以及千行百业的广泛合作,共同推动AI技术的快速发展和应用。






















