面向 Data AI 的新一代数智开发平台 - 链载Ai

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;color: rgb(0, 0, 0);font-size: 14px;text-align: justify;visibility: visible;line-height: 2em;">导读聚焦 Data+AI 融合趋势下的数智开发平台构建，系统阐述当前数据平台在烟囱式架构下的技术挑战，提出 WeData 面向 Data+AI 的新一代数智开发平台的四层设计方案。

通过 Setats 流湖一体引擎支持流/批/增量统一计算、多模态 TC Catalog 管理支持 Data+AI 全域资产治理、Serverless Computing 一体化计算资源、OneOps 一体化 Data+AI 开发环境等关键技术创新，实现数据全生命周期管理与智能开发效能提升。

实际应用案例表明，该平台在业务效率优化和成本控制方面具有显著优势，为企业数字化转型提供了新的技术路径。

介绍分为以下五部分展开：

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;visibility: visible;">1. LLM 时代的数据平台的挑战与进化

2. WeData：面向 Data +AI 的新一代数智一体化平台

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">3.Data +AI 一体化平台的关键技术

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">4. Data +AI一体化平台的应用

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">5. 总结

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">分享嘉宾｜史汉发腾讯数智开发平台WeData研发负责人，腾讯专家工程师

在数字经济快速发展背景下，数据与人工智能技术的深度融合成为企业提升核心竞争力的关键。传统数据平台采用烟囱式架构，导致大数据与AI系统割裂、计算存储成本高、数据处理效率低等问题。随着大语言模型（LLM）技术的成熟，数据平台亟需向更高效、智能的方向进化。本文基于腾讯WeData平台实践，系统探讨面向Data+AI的新一代数智开发平台的架构设计与技术实现。

在当前数据平台的实际应用中，用户需依据多样化的业务场景选择适配的计算框架：

当大数据平台完成数据加工，需要将数据直接供给至AI平台用于模型训练或预测；或AI模型预测出的数据反馈给大数据平台进行消费时，均需在两个平台间进行数据来回搬运。这种基于多种工作负载构建的烟囱式架构，衍生出一系列亟待解决的问题：

随着DeepSeek的出圈，企业可以更低门槛的落地AI技术，在LLM（大语言模型）时代，大数据平台将迎来三个方面的进化：

“Data+AI”一体化架构主要解决企业在大数据和AI业务中的痛点。它能在同一套数据基础上，支撑多样化的业务负载，帮助企业简化架构，提高数据的分析和应用效率，降低管理和运营成本。

未来Data+AI一体化平台会在一份数据基础上，支持多种大数据及AI业务负载，帮助企业有效简化架构，提升数据分析效率，从下到上大概分为以下层次：统一Lakehouse存储、统一元数据，多元异构高性能引擎和Data+AI一体化开发平台。

今年WeData会全新升级，推出面向Data+AI的新一代数智开发平台WeData3.0：在数据湖仓层我们提供了统一Lakehouse存储格式打通流湖、AI计算引擎对数据的访问，同时提供统一的元数服务，实现结构化数据和非结构化数据的统一管理；

在计算引擎层：WeData深度适配Spark、Flink、Ray、Tione等几十种大数据和AI计算服务；我们提供了统一的数据开发：在原有基础上进行全面的架构和云原生化升级，通过统一开发IDE，打通AI开发平台Tione和Agent平台LKE，新的工作流可以一体化编排数仓节点、Flink流式节点和AI模型训练节点，支撑多元计算引擎的协同数据开发；

在此之上我们提供了统一Data+AI数据治理体系，在传统结构化湖仓资产之上，增加了对AI资产的覆盖。全新推出数据血缘，从数据集、数据处理、模型训练到，推理服务，全链路可视化数据血缘；然后基于高质量资产、指标建模构建出统一语义模型的资产知识库，供给到数据智能应用。

同时在统一数据开发、数据治理链路中我们会融入AI-Native能力如代码生成、自动ETL配置，来提升数据代码工程效率。

传统Lambda架构，离线链路使用Spark基于Iceberg进行多层数据之间的转换；实时通过Flink + Kafka的方式来进行分层链路的构建；这套架构会存在以下挑战：多套存储计算，Kafka与Flink State维护成本高，实时链路数据回溯较难；离线链路存储架构是基于文件系统，分钟级延迟几乎是极限；

方案1：直接流式数据作为增量日志，同时upsert到表中，提供离线查询能力，存在数据延迟高，增量日志不完整缺少所有字段、update before信息；

方案2：将流式数据先缓存，然后定期与远程数据进行合并，再产生增量日志和更新远程数据，数据和增量日志延迟都比较高；

方案3：将绝大部分数据缓存在本地并通过本地合并，再产生增量日志和更新远程数据，除非本地能缓存所有数据，否则无法产生完整增量日志；

Setats在存储层实现一个高性能的实时数据合并引擎，当新数据到达时，可以马上与远程历史数据进行合并，产生完整的增量日志和更新后数据，实现秒级延迟

实时数据合并引擎在底层引入冷热分离的行列混存，与多级文件索引，并实现全异步的数据读写从而做到在秒级可见的前提下，实现2倍的性能提升

同样基于高性能数据合并能力，我们可以将传统flink state也存储到setats中，上层计算任务可以快速启停，进而可以将常驻流计算任务转化为定时增量计算模式。这样就实现了流、批、增量多种计算模式的统一支持，用户可以基于成本和延迟目标进行动态选择。在某出行客户应用中，告警实时处理效率提升30%，数据存储成本降低40%，IDC资源节约超30%。

当前数据平台用户需要购买多种资源如大数据提交/计算资源、AI资源；每种资源都有自己度量、镜像机制，资源直接相互隔离，无法最大化使用资源效率。

实现了资源组全面Serverless化，从原来多类型资源组统一为通用型资源组，不区分用途，可以使用平台全部能力，同时统一资源配额Quota管理，减少资源碎片化问题，用户付费灵活，按需使用

第二层：数据计算与ML计算资源融合，融合ML和计算资源，基于一体化调度实现大数据和AI作业混部，结合原生弹性扩缩容，提高资源利用率

第三层：数据计算与ML编程接口融合：推出统一编程接口，一套Python代码可完成数据处理和模型训练，避免跨平台读写和数据导入导出

当前我们是在多套平台进行大数据和AI的开发，客户需要在大数据编排平台开展DataOps，在AI训练平台开发和维护另一套AI代码，上游数据变更不能及时同步下游AI应用，带来更大运维成本；

基于此我们在Serverless资源组之上构建统一Notebook开发IDE,允许用户自定义镜像，对接GIT，一站式支持大数据、模型训练的统一编排

这样带来的优势：大数据与AI统一编排调度：多计算引擎、模型训练节点统一协同编排，一站式实现样本清洗、ML训练、推理服务，全链路追溯和可视化展现数据、模型血缘，加速AI模型的迭代；

同时在开发全链路上AI-Native化：内置Copilot实现大数据开发的自动补全、代码生成、纠错等；开发流程上提供各类Agent，实现自动建表、找数、图表见解等能力

我们在数据开发和治理链路开发了很多Tools，如不同语言类型的代码补全、纠错，元数据补全，自动ETL流程通过WeData MCP Server提供给WeDataAgent，来提升用户数据代码工程效率。

国际某商业集团使用ADF + Databricks进行数据分析及ML应用一体化开发（如销量预测）,目前已迁移到腾讯云大数据，整体成本相比原来Databricks降低70%，一体化平台完成数据分析和ML训练与推理的同时，实现全域数据资产统一视图和治理。

某新能源汽车采用云端大数据处理和IDC机器学习平台分离的架构，随着车辆交付数不断激增，希望建立Data+AI一体化的架构，降低两套系统的维护成本，迁移到腾讯云大数据，一体化平台完成车辆数据处理与机器学习。

面向Data+AI的新一代数智开发平台通过架构创新与技术突破，有效解决传统数据平台的核心痛点。该平台在提升数据开发效率、降低运营成本、拓展数据价值等方面展现出显著优势，为企业数字化转型提供了可落地的技术解决方案。未来，随着AI技术持续演进，该平台将在更多行业场景中发挥重要作用。