阿里ATH创新事业部近日宣布,其最新研发的视频生成与编辑模型HappyHorse 1.0(中文译名:快乐小马)正式启动灰度测试。创作者可通过阿里云百炼平台和HappyHorse官方网站注册使用,普通用户则能在千问App中抢先体验这一创新产品。
在盲测平台Arena.ai的最新排名中,HappyHorse 1.0在文生视频、图生视频和视频编辑三个核心榜单上均位列第二,紧随近期备受关注的字节跳动Seedance 2.0之后。为全面评估该模型的实际表现,专业团队进行了多维度测试。
该模型操作简便,用户仅需输入文字描述,即可生成3至15秒的视频内容,支持多镜头切换和连贯剧情设计。官方数据显示,HappyHorse 1.0最高支持1080p分辨率,可同时生成4个视频版本。价格方面,720p视频每秒0.9元,1080p视频每秒1.6元;Pro套餐经限时折扣后,价格分别降至每秒0.44元和0.78元。
目前,HappyHorse 1.0已集成至阿里旗下多款产品,包括阿里悟空、MuleRun和JVS Claw等Agent平台。千问App预告将推出"测一测"功能,用户可测试自己在短剧宇宙中的角色,并通过该模型生成个人"出演"的短剧片段。
测试结果显示,HappyHorse 1.0在指令响应和生成速度方面表现突出,但在物理准确性、音画同步等方面仍有改进空间。具体而言,该模型具有三大优势:生成速度快(2-5分钟/段)、指令理解能力强(支持复杂镜头和风格要求)、多元素还原度高(图生视频中人物、场景、道具还原精准)。不过,测试也发现其存在音画不同步(乐器演奏场景中手部动作与音频节奏错位)、长视频物理逻辑错误(10秒以上视频易出现物体自移动现象)、文字渲染错误(画面文字常出现乱码)等问题。
在文生视频测试中,该模型展现了强大的场景理解能力。例如,在"街头音乐表演"场景中,模型虽能准确呈现鼓手敲击、吉他演奏和观众互动等元素,但吉他手的手部动作与音乐节奏存在明显不同步。在"海边悬崖"场景测试中,模型成功模拟了海浪冲击岩石的物理效果,但近景画面中水滴下落速度偏慢。面对800词超长提示词的复杂场景描述(类似《GTA》游戏画面),模型虽能还原大部分元素,但开头出现车门无故关闭的物理错误,结尾主角形象也发生变化。
图生视频测试中,该模型支持最多9张参考图输入。在"奥尔特曼与马斯克对簿公堂"的测试案例中,模型虽能生成两人争论画面,但初期版本存在"马斯克"说中文、人物表情偏差等问题,经提示词优化后有所改善。在"离职场景"测试中,模型准确还原了上传的人物、办公室和纸箱等元素,但出现纸箱自动合上等物理错误。
行业专家评价,HappyHorse 1.0的3-15秒生成长度、快速响应能力和1080p支持是其核心优势。某AI电商营销平台技术合伙人指出,当前视频生成模型普遍存在质量不稳定问题,部分团队"抽卡率"高达50%-60%,生成时效性也有待提升。相比之下,价格因素反而是用户较易接受的维度。另一AI视频创作平台团队认为,该模型在真实感和叙事能力上表现优异,镜头运动自然,焦段运用接近实拍效果,特别适合纪录片类内容创作。





















