营收7亿元、亏损超46亿元、市值突破6200亿元——当市场用悬殊的数据为“大模型第一股”智谱华章标注成长空间时,另一家AI视觉领域的新锐企业智象未来正以截然不同的路径切入赛道。这家成立仅三年的公司,凭借自研的UiT架构(统一原生全模态架构)在文生图领域超越谷歌同类模型,跻身全球第三,其技术突破与商业策略引发行业关注。

“图像是通往世界模型的入口,也是技术角逐的核心战场。”智象未来联合创始人王科在接受专访时强调。公司自主研发的UiT架构突破传统扩散模型路径,通过算法迭代实现用极少量算力资源支撑大模型训练。这一技术路线使其在2026年6月全球第三方评测中,商用图像模型综合评分超越谷歌,成为国内首个达到该水平的团队。王科透露,UiT架构的核心目标是让AI统一理解文字、图片、视频及空间物理信息,为构建世界模型奠定基础。
在商业化层面,智象未来选择深耕B端市场。尽管成立初期曾讨论过C端战略,但团队最终聚焦企业服务。“生成式AI的本质是生产力革命,B端能直接创造降本增效的价值。”王科解释道。公司目前拥有5000万C端用户,但这些用户主要用于数据反馈而非盈利。通过服务影视制作、商业营销及社媒创作等领域,其2025年营收突破1亿元,2026年单季度收入已超全年水平。这种“隐形增长”策略使其在资本寒冬中完成两轮超6亿元融资,股东阵容涵盖国有产业基金、一线创投及影视产业链企业。
影视行业成为智象未来技术落地的关键场景。王科透露,某专业短剧工作室已整体加入公司,旨在拆解行业“know-how”。其AI视频生成工具通过“首尾帧控制”技术,将传统漫剧制作成本降低至原来的十分之一,且效果难以区分实拍与生成内容。这种效率突破源于中国影视生态的独特优势:全球最高的短视频普及率与短剧消费习惯的变革,为AI模型提供了海量训练数据与应用场景。
面对字节跳动Seedance 2.0等竞争对手,王科认为技术路线差异决定市场格局。“字节的模型深度融合影视导演能力,适合中国社交媒体生态;而国外模型如Sora因盈利空间有限且估值压力,最终选择退出。”他指出,视频类模型的竞争将聚焦于图像驱动的全模态能力,“未来需实现任意模态输入输出,图像模型是必经之路”。

在技术投入与盈利平衡方面,智象未来选择“克制迭代”策略。其2000亿参数模型通过优化算法架构降低算力消耗,避免盲目堆砌资源。“参数规模不是唯一指标,模型稳定性与算力效率才是关键。”王科表示,公司当前亏损主要源于研发投入,但已形成“模型迭代-产品优化-用户信任”的良性循环。对于行业“赢家通吃”的论调,他持否定态度:“AI是技术平权领域,各家基因不同,生态共建才是壁垒。”
随着AI短剧与短视频营销市场爆发,智象未来正加速生态布局。其服务覆盖头部电商平台、中小跨境商家及线下门店,并通过软硬件一体化产品渗透营销全链条。王科坦言,市场占有率暂无法精确统计,但签约收入已超去年全年。“风口来临时,子弹要打在获取用户与创造价值上。”他强调,公司将继续深耕技术,同时保持商业策略的灵活性。






















