连上核心业务数据;
嵌入生产流程;
一线员工每天都在用
持续可运维、可审计
的公司其实很少。大家逐渐意识到:
缺的不是模型,而是“落地工程 + 业务共创”能力。
而 Palantir 恰好有超过十年的 FDE 经验 + 一套能支撑这种落地节奏的平台,这在市场叙事中自然被放大。
Foundry:构建“企业级数据与运营平台”,包括:数据集成、数据建模、权限治理、分析、应用构建、模型/AI 接入等
AIP(AI Platform),是构建在 Foundry 之上的 AI 层,接入各种大模型(自研、OpenAI、Anthropic、本地模型等),从而构建 AI Agents / copilot / 自动化工作流
Ontology,是企业的业务运营层,相当于企业的数字孪生系统,既包含支撑各类用例所需的语义要素(对象、属性、关联关系),也整合了动态要素(操作行为、功能逻辑、动态安全机制)。
其中本体(Ontology)是被大家忽视却是很重要的一个层次,把它看成是大模型落地的最后一公里。
今天这篇文章就试图用工程语言讲清楚本体(Ontology)到底是什么,并解释在大模型时代,本体为什么从“可有可无”变成“不可缺少”。
在很多人的印象里,本体(Ontology)听上去要么很哲学,要么就是“知识图谱团队玩儿的学术玩具”。但在“概率性的模型”与“刚性的业务系统”之间,迫切需要一层语义与约束的中枢层,这就是本体。
如果从企业 AI 的视角,建议暂时忘掉 OWL、RDF 这些术语,把本体理解成三件事:
本体 = 企业级的业务概念模型 + 语义统一层 + 可执行约束。
与常见几种东西区别非常关键。
数据模型是存储视角,本体是业务语义视角。
数据模型(schema)关心的是:
本体关心的是:
这个“东西”在业务世界里是谁?客户、订单、设备、风险事件、工单……
它和其他“东西”是什么关系?客户下订单、订单占用库存、设备位于产线、合同约束交易……
允许对它做哪些“动作”?审批、取消、关停、调度、预警、打标……
知识图谱通常指“由节点+边构成的数据结构”,本体在其中扮演的是:
简单类比:
没有本体的知识图谱,对 LLM 和业务来说,往往只是一堆“结构化数据”;
有了本体,它才是一个带语义、可推理的业务世界镜像。
可以这样总结:
OOP 说的是“这段代码世界里东西怎么组织”;
本体说的是“整个企业业务世界里,事物究竟是什么、怎么相连、允许发生什么”。
在 LLM 时代,我们第一次真的需要把后者做清楚——否则,模型的“聪明”无处安放。
过去,很多企业即便没有本体,也能靠报表、规则引擎过日子;
而在 LLM 驱动的“智能体(Agent)”、“AI Copilot”、“AI 工作流”时代,本体的价值被成倍放大。
结合近期的行业实践,可以从五个方面来看:
LLM 原生擅长的是语言模式匹配:
而本体 + 知识图谱告诉模型的是:
研究和实践都在强调:
将 LLM 接到显式建模的本体与知识图谱上,能显著提高回答的事实正确性与术语一致性。
换句话说,本体把很多问题从“开放式写作题”变成了“在结构化世界中检索 + 推理”的组合题,大幅压缩了“胡编空间”。
目前企业应用 LLM 的常见路径:
阻力往往出现在第二步:给模型暴露几十上百个底层 API(SQL、REST、RPC),它很难:
而以本体为中心的做法,是把“业务对象 + 允许的动作”暴露给模型:
update_order_status这个表级别接口”,Order对象执行cancel()、approve()、reschedule()等动作。Palantir 就把这种模式总结为“用本体把数据、逻辑和动作组合成决策中心的企业模型”,上层 AI 只需要围绕这些对象和动作做推理与调用。
从模型视角来看:
我国企业信息化的“后遗症”是:
在 AI 驱动的时代,仅仅把数据搬到一个湖里远远不够。
本体做的,是在各系统之上加一层“企业统一语义”:
这样,上层 AI 和应用就不再直接面对底层 ERP、CRM、MES 的细节,而是统一面向“本体层”。
这不仅大幅降低了集成复杂度,也使得跨系统、跨部门的智能体成为可能。
当你开始允许 LLM 对真实系统“写入”时,安全和合规的风险成倍上升:
传统权限控制大多挂在“表”、“接口”或“服务”上;
本体则允许在“业务对象 / 属性 / 动作”粒度上设定策略:
这样,AI 无论多“聪明”,都只能在本体定义的安全边界内活动。
合规团队也可以围绕本体对象和动作来设计审计报表与风控规则。
大模型的一个天然弱点是:
很多能力来自“黑箱内部参数”,难以审计和迁移。
本体却反其道而行:
当前不少研究也在探索如何用 LLM 辅助本体构建与演进(自动建议概念、关系、对齐规则等),但共识都是:高质量本体仍然离不开人的业务理解与治理。
不必从哲学开始,也不必一次性搞成国家级工程。更现实的做法可以分为六步:
例如:
不要试图一口吃下“全企业本体”,而是选一个“足够痛、足够值”的场景做最小可行本体(MVO)。
组织业务专家、架构师、数据团队一起回答几个问题:
把这些东西画成概念层本体图,不急着写任何代码。
这一层一旦打好,查询和分析立刻就能提升一大截,而 LLM 后续也能基于此做高质量。
围绕本体中的对象,设计一组“AI 可以申请执行”的动作,例如:
Order.approve() / Order.cancel() / Order.reassign()
Machine.schedule_maintenance() / Machine.shutdown()
Customer.flag_risk() / Case.escalate()
这些动作背后可以是:
但暴露给 LLM 的,是业务语义清晰的“原子动作”,并在本体层定义权限与审计策略。
不少研究已在探索利用 LLM 自动建议本体结构、辅助本体构建和对齐工作,从而降低维护成本,但“人制定标准、机器帮着填空”的模式短期内仍是主流。
真正有价值的本体,不是某次咨询项目的交付物,而是企业最长期、最可迁移的数字资产之一。
有一个真实案例“政务AI前置数据治理的新范式”,可以去https://www.aidd.vip/dhrc-sz2025 下载。
误区 1:本体 = 又一轮“大而全”的中台工程
纠偏:
本体更适合“从小而精、高价值领域起步,逐步生长”。
建议采用“领域分治 + 渐进扩展”的方式,而不是一开始就搞“某某集团统一企业本体覆盖全部业务”。
误区 2:本体 = 学术和图数据库团队的内部兴趣项目
纠偏:
在大模型时代,本体首先是一个业务资产和安全资产,其价值远超“某种存储技术”。
应当由业务、架构、数据、AI 团队联合“共管”,而非挂在某个角落团队自行玩耍。
误区 3:有了本体,就可以不管模型质量
纠偏:
本体提供的是世界观和约束条件,但推理能力仍依赖模型本身。
正确姿势是:高质量模型 + 高质量本体 + 高质量数据,三者缺一不可。
大模型正在迅速商品化:
真正难以复制、并且越用越值钱的,是你们对自身业务世界的显式建模能力——也就是这套本体。
没有本体,LLM 永远只是一个“通用聪明人”,但在你的系统面前却如履薄冰;
有了本体,它才真正有机会成为一个懂你业务、遵守你规则、能安全办事的专属超级员工。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |