阿里HappyHorse 1.0上线实测：生成GTA式画面，马斯克奥尔特曼“隔空交锋”-数码-沃资讯

阿里HappyHorse 1.0上线实测：生成GTA式画面，马斯克奥尔特曼“隔空交锋”

发布时间：2026-04-27 22:14 来源：天脉网作者：杨凌霄

阿里ATH创新事业部近日宣布，其最新研发的视频生成与编辑模型HappyHorse 1.0（中文译名：快乐小马）正式启动灰度测试。创作者可通过阿里云百炼平台和HappyHorse官方网站注册使用，普通用户则能在千问App中抢先体验这一创新产品。

在盲测平台Arena.ai的最新排名中，HappyHorse 1.0在文生视频、图生视频和视频编辑三个核心榜单上均位列第二，紧随近期备受关注的字节跳动Seedance 2.0之后。为全面评估该模型的实际表现，专业团队进行了多维度测试。

该模型操作简便，用户仅需输入文字描述，即可生成3至15秒的视频内容，支持多镜头切换和连贯剧情设计。官方数据显示，HappyHorse 1.0最高支持1080p分辨率，可同时生成4个视频版本。价格方面，720p视频每秒0.9元，1080p视频每秒1.6元；Pro套餐经限时折扣后，价格分别降至每秒0.44元和0.78元。

目前，HappyHorse 1.0已集成至阿里旗下多款产品，包括阿里悟空、MuleRun和JVS Claw等Agent平台。千问App预告将推出"测一测"功能，用户可测试自己在短剧宇宙中的角色，并通过该模型生成个人"出演"的短剧片段。

测试结果显示，HappyHorse 1.0在指令响应和生成速度方面表现突出，但在物理准确性、音画同步等方面仍有改进空间。具体而言，该模型具有三大优势：生成速度快（2-5分钟/段）、指令理解能力强（支持复杂镜头和风格要求）、多元素还原度高（图生视频中人物、场景、道具还原精准）。不过，测试也发现其存在音画不同步（乐器演奏场景中手部动作与音频节奏错位）、长视频物理逻辑错误（10秒以上视频易出现物体自移动现象）、文字渲染错误（画面文字常出现乱码）等问题。

在文生视频测试中，该模型展现了强大的场景理解能力。例如，在"街头音乐表演"场景中，模型虽能准确呈现鼓手敲击、吉他演奏和观众互动等元素，但吉他手的手部动作与音乐节奏存在明显不同步。在"海边悬崖"场景测试中，模型成功模拟了海浪冲击岩石的物理效果，但近景画面中水滴下落速度偏慢。面对800词超长提示词的复杂场景描述（类似《GTA》游戏画面），模型虽能还原大部分元素，但开头出现车门无故关闭的物理错误，结尾主角形象也发生变化。

图生视频测试中，该模型支持最多9张参考图输入。在"奥尔特曼与马斯克对簿公堂"的测试案例中，模型虽能生成两人争论画面，但初期版本存在"马斯克"说中文、人物表情偏差等问题，经提示词优化后有所改善。在"离职场景"测试中，模型准确还原了上传的人物、办公室和纸箱等元素，但出现纸箱自动合上等物理错误。

行业专家评价，HappyHorse 1.0的3-15秒生成长度、快速响应能力和1080p支持是其核心优势。某AI电商营销平台技术合伙人指出，当前视频生成模型普遍存在质量不稳定问题，部分团队"抽卡率"高达50%-60%，生成时效性也有待提升。相比之下，价格因素反而是用户较易接受的维度。另一AI视频创作平台团队认为，该模型在真实感和叙事能力上表现优异，镜头运动自然，焦段运用接近实拍效果，特别适合纪录片类内容创作。

更多>同类内容