AI视频生成赛道近期风云变幻,先是Seedance 2.0陷入版权争议,后是OpenAI宣布关停Sora独立应用及相关API,行业格局面临重塑。就在外界对这一赛道前景产生疑虑时,阿里巴巴推出的HappyHorse-1.0模型横空出世,在Artificial Analysis榜单上同时登顶文生视频和图生视频(无音频)两个赛道,力压字节、快手等竞争对手,为行业注入新的活力。
HappyHorse的崛起与张迪的回归密不可分。张迪毕业于上海交通大学计算机专业,本硕连读后于2010年加入阿里巴巴,长期负责阿里妈妈的大数据和机器学习工程架构。在阿里工作的十年间,他积累了处理大规模数据、复杂工程系统的经验,这些能力为后续的技术突破奠定了基础。2020年,张迪离开阿里加入快手,历任技术副总裁、大模型与多媒体技术团队负责人,主导了可灵大模型的底层架构研发与应用落地。可灵大模型让快手从内容分发平台升级为内容生产基础设施提供商,构建了完整的业务闭环。2025年9月,张迪短暂加入B站,两个月后重返阿里,出任淘天集团“未来生活实验室”负责人,职级P11。
张迪的职业路径独特,他既非从零开始涉足AI视频领域,也非单纯从外部空降阿里。他先在阿里熟悉大规模商业系统的运作,又在快手将视频生成技术转化为实际产品,如今回到阿里,将这套能力融入更大的商业生态中。这种复合型背景使他能够同时理解模型技术、业务需求和组织架构,成为推动HappyHorse项目落地的关键人物。
HappyHorse的成功并非偶然。该模型采用150亿参数、40层统一自注意力Transformer架构,将文本、视频、音频三种模态的token放入同一序列联合建模,解决了传统视频生成模型中人物嘴型与声音不同步、表情与语气不匹配等问题。它原生支持英语、普通话、粤语、日语、韩语、德语、法语等多种语言的唇形同步,显著提升了视频生成的质量。在生成效率方面,HappyHorse在单张H100 GPU上生成5秒1080p视频仅需38秒,并采用DMD-2蒸馏技术将去噪步骤压缩至8步,大幅降低了生成成本和时间,为商业化应用铺平了道路。
与闭源模型不同,HappyHorse选择开源路线,允许开发者自托管、微调并接入自有产品。这一策略不仅吸引了社区反馈,加速了模型改进,还通过用户偏好投票在Artificial Analysis榜单上取得领先。开源模式使HappyHorse能够快速暴露问题并拓展应用场景,而非仅依赖公司内部团队的迭代。
HappyHorse对阿里的意义远不止于技术突破。作为淘天集团“未来生活实验室”的成果,该模型直接服务于阿里的核心业务——电商。在电商场景中,商品视频是提升转化率的关键工具,但传统视频制作成本高、周期长,中小商家难以承担。HappyHorse通过批量生成不同版本视频,并利用商品图、详情页、评价、搜索词等数据优化内容,帮助商家更高效地触达目标用户。例如,一个太阳能喷泉泵通过AI视频被包装成鸟浴盆、鱼池和儿童浴缸的喷水玩具,销量激增。这种“功能说明”到“使用场景”的转化,正是电商内容的痛点所在。
阿里在电商领域的优势为HappyHorse提供了独特的反馈闭环。商品数据、交易反馈和用户行为可被用于训练模型,使其生成更符合销售需求的视频。未来,HappyHorse有望成为电商操作系统的一部分,从简单的视频生成工具进化为能够预测用户偏好、优化内容的智能平台。这一过程中,阿里需平衡创新与合规,避免AI生成内容夸大商品效果,损害消费者信任。
随着HappyHorse的登场,AI视频赛道的竞争进入新阶段。张迪的回归和阿里的战略布局,为行业提供了新的思路:技术突破需服务于商业价值,开源与闭环反馈可成为制胜关键。未来,HappyHorse能否持续领先,将取决于其能否在电商场景中进一步深化应用,并拓展至广告、直播、教育等领域。阿里的这一尝试,或许正在重新定义AI视频技术的商业边界。



















