Oracle 与 dify 携手推出深度集成方案,将 Oracle Database 26ai 的向量存储与检索能力,与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成,企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据,利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性,快速构建基于私有数据的 RAG 检索与智能问答应用。
统一数据平台:在 Oracle 数据库中实现向量存储
通过 Dify 的可视化工作流(Knowledge Pipeline),企业可以将文档、图片、音频等非结构化数据处理为向量并存入知识库。得益于 Oracle Database 26ai 的原生向量管理能力,这些向量数据可以直接存储在 Oracle Database 26ai 中,无需部署独立的向量数据库,也能满足企业级的数据治理与安全要求。
在性能层面,Oracle 的 Partitioning(分区)、RAC(Real Application Clusters)和 Exadata 优化技术为这一集成提供了技术保障,即使在 PB 级数据规模下也能保持高性能与稳定性。
对于已经使用 Oracle 数据库的企业,可以在同一平台上管理业务数据和 AI 向量数据,无需在多个系统间迁移和同步数据,从而降低运维成本并提升数据管理效率。
以下步骤展示如何在 Oracle Cloud Infrastructure(OCI)环境下,通过 Oracle Container Engine for Kubernetes(OKE)集群部署 Dify 企业版,并将 Oracle Database 26ai 配置为向量存储。
环境要求:Kubernetes 1.26+、Oracle Database 26ai(PDB 模式)
首先,我们需要自定义 OKE 的 VCN(Virtual Cloud Network),为 Dify 的 Pod 提供安全、独立且可访问外网的网络环境。
关键步骤包括:
新建 Pod 私有子网及独立路由表,配置 NAT 网关以确保 Pod 能访问外网以拉取插件与依赖;同时创建安全组并开放必要端口。
使用 “Custom Create” 模式,分配相应子网给 API、Worker 与 Pod 节点;
建议配置 3 个节点以保障高可用性,并将启动盘调整至 ≥50GB;
上传 SSH 公钥以便后续节点维护。
- 通过 Helm 获取 Dify 企业版安装包;
- 修改 values.yaml 配置文件,若使用自建 PostgreSQL、Redis、MinIO 等组件,需要启用 externalPostgres、externalRedis 等外部配置;
- 创建 PVC 并分配 50Gi 存储空间以持久化数据。
- 执行 helm install ingress-nginx 部署负载均衡 Ingress Controller;
- 当 Ingress 获取外部 IP 后配置域名解析;
- 通过浏览器访问 Dify 控制台,完成授权注册、初始用户创建以及插件安装(如 LLM 模型插件、数据库查询插件等)。
核心集成步骤:启用 Oracle DataDatabase 26ai 向量存储能力
要让Dify 支持 Oracle Database 26ai 的向量存储与检索,需要在数据库与 Dify 两侧进行配置。
Oracle 端预配置:创建专属向量检索环境
1、切换至目标 PDB 容器:
show pdbs;alter session set container=PDB1;
create user dify identified by dify_123 default tablespace users quota unlimited on users;
grant db_developer_role to dify;
BEGIN CTX_DDL.CREATE_PREFERENCE('dify.world_lexer', 'WORLD_LEXER');
END;
1、修改 values.yaml 文件,添加 Oracle 连接信息:
externalType: "oracle"
externalOracleVectoRS:
dsn: "Oracle_IP:1521/PDB1"
user: "dify"
password: "dify_1234"
config_dir: "/app/api/storage/wallet"
wallet_location: "/app/api/storage/wallet"
is_autonomous: "false"
2、修改 vectordb-config.yaml 与 vectordb-secret.yaml,确保环境变量正确挂载并使用 b64enc 加密密码。
3、执行 helm upgrade 更新配置,并在 API 与 Worker Pod 中验证环境变量是否生效(确认 VECTOR_STORE=oracle)。
完成部署后,企业即可利用 Oracle Database 26ai 的多模态向量存储与 Dify 的 Knowledge Pipeline 能力,快速构建企业级 RAG 应用。
1、Knowledge Pipeline 创建与数据写入
在 Dify 创建好的 Knowledge Pipeline 里上传多模态文件(如包含文本与图表的 PDF),系统会自动进行语义切分并生成向量数据。
Dify提供了5个预置 Knowledge Pipeline 模板,支持从纯文本文档到包含表格的复杂 PDF 文件,覆盖常见的文档解析场景。
这些向量数据会自动存入 Oracle Database 26ai。执行以下 SQL 语句验证数据写入:
2、 RAG 搜索验证
在 Dify 知识库的「召回测试」中输入查询关键词(如 Oracle 26ai vector features),系统将自动从 Oracle Database 26ai 检索相关向量片段并返回相似度分数。
示例结果如下:
“AI vector search built into Oracle Database and leveraging partitioning, RAC, sharding, and Exadata for industrial-grade scalability.”(得分 0.65)
“Oracle 26ai supports a variety of vector operations.”(得分 0.64)
结果表明 RAG 检索功能运行正常,查询准确且响应迅速。
Oracle Database 26ai 是面向 AI 时代的企业级数据平台,具备原生向量管理功能以支持多模态向量数据存储与检索(无需依赖第三方工具),凭借 Oracle 的分区、RAC、Exadata 技术支持,确保了 PB 级数据规模下的高性能与高可用性,并提供标准化接口实现 LLM 与私有数据集成,降低 AI 应用开发复杂度。
Dify 是一个开源的 LLM 应用开发平台,提供低代码可视化环境,支持拖拽式搭建 Workflow ,集成模型管理、可观测性功能,覆盖从原型设计到生产部署的全过程,有效降低了技术门槛,为企业提供可靠且能持续迭代的 AI 应用基础设施,帮助用户构建稳定、可扩展的生产级 LLM 应用。