百度文心Moment大会启幕 文心5.0正式发布 引领AI应用新变革

   发布时间:2026-01-23 06:02 作者:孙雅

百度近日正式推出原生全模态大模型文心5.0,标志着其在人工智能领域的技术突破迈入新阶段。该模型采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一框架下联合训练,实现了真正的多模态统一理解与生成。与传统的“后期融合”方案不同,这一技术路线使多模态特征在统一架构下充分融合,避免了拼接式处理的局限性。

文心5.0的参数规模达2.4万亿,通过超大规模混合专家结构实现超稀疏激活,激活参数比低于3%,在保持强大能力的同时显著提升了推理效率。模型还引入了基于思维链和行动链的端到端多轮强化学习训练方法,结合大规模工具环境合成的长程任务轨迹数据,大幅增强了智能体和工具调用能力。在40余项权威基准测试中,其语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等国际主流模型,图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。

应用层面,文心5.0已构建起覆盖通用场景与行业需求的模型矩阵。矩阵模型包括文心Lite、视频大模型和语音大模型,面向产品级应用快速落地;专精模型则针对搜索、电商、数字人等垂直领域开发,如搜索闪电专精模型、电商蒸汽机模型等。百度应用模型研发部负责人透露,基于声音Token的端到端合成大模型通过离散语音表示、MoE韵律建模和Unet自重构特征等技术,实现了高质量语音合成;5分钟直播技术通过少量音色采样和韵律模式匹配,使合成语音具备直播带货所需的情绪感染力;实时交互数字人技术采用三态Token联动架构,突破传统模态串联模式,实现文本、语音、视频的流式控制,百度罗永浩数字人即基于此技术开发。

为推动大模型在产业中的落地,百度千帆平台推出Agent Infra解决方案,提供包括文心5.0在内的150余个全场景模型服务,集成百度AI搜索等工具及MCP和Agent工具链,结合数据管理和企业级服务,为企业提供全周期、多场景的业务运行环境。目前,千帆平台已累计开发超130万个Agents,以百度AI搜索为代表的工具日均调用量突破千万次。此前,百度数字人技术已在直播带货等领域广泛应用,2025年罗永浩数字人直播曾创下行业纪录。

作为国内大模型领域的先行者,百度正通过“芯云模体”全栈自研生态闭环持续探索AI赋能行业的路径。该生态以芯片为底座、智能云为平台框架、模型为支撑,形成覆盖硬件、算法、应用的完整链条,为AI技术从实验室走向真实场景提供了可复制的解决方案。当前,全球AI行业正加速向应用层拓展,如何让技术真正服务于产业需求成为关键课题,百度的实践为这一方向提供了重要参考。

 
 
更多>同类内容
全站最新
热门内容