谷歌I/O大会:AI一站式服务亮相,安卓XR平台能否颠覆未来?

   发布时间:2025-05-21 21:48 作者:杨凌霄

在科技界的瞩目之下,谷歌于5月21日凌晨举办了I/O 2025开发者大会,这场盛会不仅聚焦于前沿的AI技术,还揭示了安卓XR平台和安卓16的最新规划及特色功能。

谷歌首席执行官Sundar Pichai在大会上透露,自去年以来,谷歌AI大模型和API的处理能力实现了巨大飞跃,从每月处理9.7万亿个Token增长到480万亿个。同时,谷歌搜索业务中的AI综述功能已吸引了15亿月活跃用户,彰显了AI技术的广泛影响力。

AI正逐步渗透至我们生活的方方面面,成为不可或缺的元素。无论是谷歌推出的新一代AI大模型、AI应用,还是XR平台和手机系统,都与AI技术紧密相连。

在本次大会中,AI无疑是主角,发布的新品数量最多。备受期待的Gemini 2.5系列终于确定将于6月正式上线,其中Gemini 2.5 Pro被誉为全球最智能的AI模型,在LMArena的ELO基准测试中取得了1448分的高分。Gemini 2.5 Pro还推出了深度思考版本,在多项测试中表现优于基础版。而Gemini 2.5 Flash作为轻量级模型,效率提升了22%,Token使用量减少了20%至30%,资源消耗更低。

Gemini 2.5系列还新增了文本转语音功能,细节表现丰富,甚至能模拟窃窃私语,非常适合个人创作者为影视作品配音。谷歌还推出了文本扩散模型Gemini Diffusion,该模型采用逐步优化噪声生成内容的方式,在编程和数学领域展现出卓越性能。

基于Gemini 2.5系列的能力,谷歌的Project Mariner项目也有望加速落地。该项目此前代号为Jarvis,是一个能够操作浏览器和其他软件的AI智能体,能同时监督多达10个任务,并通过用户展示的任务操作进行学习。

谷歌将包括Gemini 2.5系列在内的强大AI功能整合到谷歌搜索中,通过AI搜索提供图表生成、票务查找以及视频、地图等信息,使搜索结果更加丰富多样,相较于传统搜索模式具有更大优势。

谷歌还展示了智能购物功能,用户只需上传个人照片,AI就能将商店里的衣服自动“穿戴”到照片中的人物身上,帮助用户更直观地判断衣服是否合身。

除了多模态大模型Gemini 2.5系列,谷歌还发布了文生图模型Imagen 4和视频生成模型Veo 3。Imagen 4生成图片的速度比上一代快3到10倍,细节更加丰富,能生成复杂物体如织物、水滴、动物毛发等,分辨率高达2K,还能制作贺卡、海报、漫画等。Veo 3则大幅提升了生成画面的质量,首次支持生成带有音频的视频,效果惊人。

谷歌专为内容创作者打造的AI电影创作应用Flow,集合了Veo、Imagen和Gemini模型的能力。据谷歌介绍,Flow可以通过输入文字或导入素材创作视频,并通过Gemini对自然语言的理解微调视频,将电影创作从专业领域推向大众。未来,随着Flow能力的不断增强,或许将颠覆传统的影视剧制作模式。

在XR领域,谷歌与三星联手开发的安卓XR平台自去年公布以来,已获得数百家软件开发商的支持。大会上,基于该平台的首款XR设备——三星Project Moohan亮相,该产品搭载骁龙XR2 Plus Gen 2芯片,无需连接PC或其他设备,能够独立运行,预计将于今年晚些时候发售。同时,中国企业Xreal开发的Project Aura也亮相大会,这是首款基于安卓XR平台的AR眼镜,支持光学透视和虚拟透视的沉浸式体验。

谷歌表示,与AI深度融合的安卓XR平台支持第一人称视角智能辅助和无接触辅助功能,用户可以通过自然语言与设备交互,完成信息查询、日程管理、实时导航等操作。安卓XR平台有望统一非苹果XR设备的系统生态,降低软件开发成本,激发开发者积极性。

谷歌还公布了Wear OS 6和安卓16的部分功能和特性。Wear OS 6融合了Material 3 Expressive设计语言,更适合圆形屏幕,并引入了动态色彩主题。而安卓16则主要围绕Live Updates功能,该功能与苹果的Live Activities相似,可以显示导航、外卖配送、网约车状态等信息。

谷歌在大会上还推出了为安卓手机打造的全能AI助手Project Astra,能够根据使用场景和用户要求主动制定解决方案并采取行动。这一功能可能基于多模态Gemini Nano模型的视觉识别能力,具有普适性,无需与应用一对一适配。

随着AI和XR技术的不断成熟,产品更加注重实用性。谷歌发布的众多AI大模型,如端侧多模态模型Gemma 3n和基于Gemma 3架构的开源医疗模型MedGemma,都与搜索引擎、安卓XR、安卓16深度融合,致力于提升用户体验。

 
 
更多>同类内容
全站最新
热门内容
本栏最新