数据新时代:阿里云引领的Data+AI基础设施变革

   发布时间:2025-07-23 19:01 作者:任飞扬

在大数据领域,一个生动的比喻曾引领无数企业踏上探索之旅。2006年,英国数学家克莱夫·洪比将数据比作“新石油”,这一说法迅速成为大数据企业自我正当化的金句。然而,洪比未曾言明的是,与石油的消耗性不同,数据在使用中却能不断增殖。数据经过AI的“点燃”,能裂变产生更多新信息,这一特点在过去三年里尤为显著,尤其在GenAI技术的催化下。

GenAI加速了“数据-模型-场景”价值闭环的运转,使数据从辅助决策的边缘角色跃升为企业决策的核心资产。这一变革虽微小,却可能重构整个大数据产业的格局。资本迅速捕捉到了这一趋势,2024年末,数据智能公司Databricks获得了100亿美元融资,将“Data+AI”理念推向市场前沿。

这股热潮也席卷了中国市场。上海数据交易所作为官方代表之一,半年内实现了30亿元的数据交易额,并联合产业伙伴成立了区块链跨链实验室,计划三年内建立1000座“数纽中心”。这标志着数据流通首次被真正视为基础设施,与电网、高铁并驾齐驱。

在此背景下,各大厂商纷纷将“Data+AI”纳入未来战略规划。云厂商、运营商、系统集成商乃至老牌ERP巨头,只要有大数据业务,都不约而同地将这一理念置于战略显眼位置。其中,阿里云在7月23日的飞天发布时刻上,宣布了大数据平台ODPS的“Data+AI”战略升级,针对GenAI时代企业的新需求,升级了ODPS产品家族,涵盖ODPS-MaxCompute、ODPS-Hologres、ODPS-DataWorks等核心产品。

阿里云的这一升级不仅为“Data+AI”热潮添柴加薪,更释放出一个深层信号:在AI时代,大数据平台正从数据处理工具集转变为底层数据基础设施。ODPS已率先完成这一转型。

“Data+AI”之所以成为大势所趋,源于企业面临的数据困境日益复杂。数字化转型遗留的“数据孤岛”问题尚未解决,GenAI又带来了多模态数据处理、实时性、算力及治理能力的新挑战。这些挑战要求业界呼唤一种全局思维、全能型的数据基础设施。

回顾历史,阿里巴巴在电商业务快速发展时也曾遭遇“数据孤岛”困扰。因此,自2009年启动“飞天”项目以来,阿里便同步布局大数据业务。阿里云针对不同数据生命周期环节,提供了一系列专业化工具和平台。例如,为解决海量数据的离线存储和计算问题,阿里云自研了ODPS平台;为满足企业对数据分析的实时性要求,推出了实时数仓Hologres。

然而,GenAI的到来彻底改变了游戏规则。它要求数据平台不仅能存储和处理异构数据,还要能进行高效的跨模态对齐、融合与处理。同时,数据处理与AI模型训练需无缝衔接,全链路治理与安全也成为新的挑战。这些环环相扣的挑战构成了一个复杂的系统性难题,要求数据平台像电网、高铁一样,成为稳定、可靠且能无缝集成各种功能的底层支撑。

阿里云ODPS的此次升级,正是从底层架构上重新定义了“数据”与“AI”的关系。以往,数据平台和AI平台往往是两个独立体系,通过ETL或API衔接。但在GenAI时代,这种模式显得笨拙低效。阿里云通过MaxCompute升级,将AI能力嵌入数据平台,实现了数据存储、计算、治理与AI环节的深度融合。

ODPS以对象存储OSS为统一数据湖底座,结合数据湖构建(DLF)进行统一的元数据管理,解决了结构化、半结构化和非结构化数据的统一存储和治理难题。MaxCompute和Hologres构建了离线实时一体化能力,让数据在湖与仓之间自由流动,同时平衡了数据计算的时效性与成本。

MaxCompute推出的新一代分布式计算框架Maxframe,与社区Pandas接口兼容,可直接在ODPS的海量数据上进行分布式计算。这意味着从数据预处理到AI模型训练,整个流程都可在统一框架内完成。人工智能平台PAI也可直接在MaxCompute的数据上进行模型训练和部署,实现“存算训”一体化。

DataWorks作为ODPS技术体系的“指挥中心”,提供了千万级任务调度能力和主动式数据资产治理服务,保障了Data+AI一体化开发的高效稳定运行。它不仅支持多种计算引擎的混编任务流,还集成了智能Copilot助手,通过自然语言生成SQL,提升数据开发与分析效率。

阿里云通过这一系列核心能力的升级,构建了一个从数据到智能的闭环。数据在统一的湖仓底座上被高效治理和处理,无缝流转至AI平台进行模型训练与推理,最终通过智能应用对外提供服务。这一闭环的形成,标志着ODPS已从“大数据工具组合”转型为“AI时代的数据基础设施”。

然而,“Data+AI”的普及仍面临挑战。企业在拥抱Data+AI时,最大的障碍往往不是技术本身,而是组织文化和人才储备。要成功转型,企业必须培育“数据驱动决策”的文化,提升员工的数据素养。同时,AI时代的人才缺口也日益凸显,企业需要既懂技术又懂业务的复合型人才。

尽管“Data+AI”的技术边界尚不明朗,但从企业核心需求及阿里云ODPS的升级中,AI时代数据基础设施的面貌已逐渐清晰。关键特征包括“统一”、“智能”和“开放”。在这些特征下,Data+AI的竞争焦点正从模型强大转向谁能构建出更好用的数据基础设施,帮助企业释放数据价值。

在这场平台之战中,云厂商凭借从IaaS到PaaS再到SaaS的完整技术栈占据先发优势。未来,云将成为企业部署AI必备的业务支撑,一体化平台构建的“客户粘性”将成为云厂商最深的护城河。然而,Data+AI并非云厂商的独角戏,专注于数据领域的“专业型选手”同样值得关注。构建一个开放、共赢的生态系统,成为所有玩家的必然选择。

 
 
更多>同类内容
全站最新
热门内容
本栏最新