近日,全球人工智能领域迎来一则重磅消息:一款名为HappyHorse-1.0的新型视频生成模型悄然问世,并在国际权威AI评测平台Artificial Analysis的Video Arena榜单中斩获佳绩。该模型由阿里巴巴旗下淘天集团未来生活实验室研发,在没有大规模宣传的情况下,直接登顶文本转视频和图像转视频(无音频)类别的全球榜首,同时在带音频类别中位列第二,引发行业高度关注。
根据公开技术资料,HappyHorse-1.0采用40层单流自注意力Transformer架构,参数量达150亿,具备原生音视频同步生成能力。这一特性使其无需后期配音或口型对齐处理,即可直接输出高质量视频内容。在性能测试中,该模型在单张H100显卡上生成1080p分辨率视频仅需约38秒,显著优于同类产品。
在评测平台公布的Elo评分体系中,HappyHorse-1.0以1357分的成绩超越字节跳动Seedance 2.0等竞争对手。其多语言支持能力同样突出,目前可处理英语、普通话、粤语、日语、韩语、德语和法语七种语言的输入指令,覆盖全球主要语言市场。技术团队透露,模型通过DMD-2蒸馏技术优化了计算效率,这是实现高速生成的关键突破。
值得关注的是,研发方选择在4月9日同步开源该模型代码,此举或将加速视频生成技术的普及进程。行业分析师指出,HappyHorse-1.0的推出标志着AI视频生成领域进入新的竞争阶段,其架构设计和工程实现对后续研发具有重要参考价值。不过目前官方尚未公布具体应用场景,市场正持续关注其商业化落地进展。





















