火山引擎在一场行业活动中宣布,旗下豆包大模型的日均Token使用量已突破120万亿,较发布初期增长千倍,且近三个月内实现翻倍。这一数据背后,是企业级客户对AI服务的规模化采购——累计Token消耗超万亿的企业客户从2025年底的约100家增至140家,个人用户用量近一个月暴增16倍。与此同时,智谱AI公布的财报显示,其2025年全年收入超7.24亿元,MaaSAPI平台年度经常性收入突破17亿元,注册用户覆盖全球218个国家和地区。英伟达则加速布局硅光子技术,三个月内向三家光通信企业投资60亿美元,押注AI算力集群的光互联升级。
AI应用的爆发式增长直接推动了Token消耗的激增。以视频生成为例,字节跳动自研的Seedance2.0模型因生成1分钟720p视频需消耗超百万Token,导致2026年春晚特效制作期间排队人数长期维持在9万人左右。尽管如此,其制作效率较传统模式提升一倍,成本下降70%,成为推动豆包Token用量翻倍的核心因素。另一大消耗场景来自智能体任务执行——升级后的ArkClaw智能体可联动多平台完成跨工具协作,单次企业级任务消耗数十万至百万Token。中信证券测算,智能体普及使整体Token消耗提升十倍以上,算力需求增长百倍。
中国大模型的成本优势成为全球开发者“用脚投票”的关键。数据显示,中国西部绿电价格仅为美国的1/4至1/5,结合MoE架构、极致量化等技术优化,中国模型的推理成本被压缩至美国模型的1/6至1/10。在API定价上,中国头部模型的输入成本普遍低于0.3美元/百万Token,输出成本不足2.6美元/百万Token,而美国同类产品价格高出数倍至数十倍。尽管中国开发者在OpenRouter平台的用户占比仅6.01%,但周Token调用量占比达61%,全球前九大模型中中国占据五席,形成“低价高用”的独特格局。
海外巨头正面临前所未有的挑战。OpenAI的ChatGPT网页流量份额从2025年1月的86.7%暴跌至2026年1月的64.5%,月活用户环比下降6.5%,运营亏损预计达140亿美元。Google虽将Gemini份额提升至21.5%,但开发者流失25%,被迫推出低价版GeminiFlash仍难与中国模型竞争。xAI的Grok模型使用率下滑40%,成本是中国模型的10倍,几乎与性价比市场绝缘。市场分析认为,未来全球AI市场将形成分层格局:美国模型守住20%高端用户,拿走80%收入;中国模型覆盖80%大众用户,以规模化落地获取20%收入。
算力需求的指数级增长倒逼技术迭代。传统铜缆互联在万卡集群中浪费70%算力,硅光子技术凭借带宽提升10-100倍、功耗降低70%的优势成为唯一解。英伟达通过投资Lumentum、Coherent锁定1.6T光模块核心材料,向Marvell开放NVLink协议定制芯片,完成对光互联生态的系统性布局。市场预测,2026年全球EML光芯片需求达3.5亿颗,产能缺口1.5亿颗,相关赛道已涌现大批估值超十倍的牛股,资金持续涌入推动技术商业化加速。
中国AI的结构性红利期至少可持续三年。能源壁垒方面,“东数西算+西部绿电”体系使中国绿电成本长期低于0.3元/度,美国难以复制;规模壁垒下,Token调用量越大单位成本越低,正向循环已形成;生态壁垒上,中国开源大模型下载量居全球第一,基于通义千问等模型的衍生项目超18万个,开发者迁移成本极高。这些优势将支撑中国大模型在普惠AI市场持续主导,直至2028年仍可享受技术红利窗口期。




















