返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

学习 Coze Studio 的代码架构

[复制链接]
链载Ai 显示全部楼层 发表于 半小时前 |阅读模式 打印 上一主题 下一主题
经过几天的实战和学习,我们已经全面体验了 Coze Studio 从智能体、插件、工作流到知识库的各项核心功能。今天,我们开始研究下它的源码,看看这些功能背后的实现原理。

项目架构



Coze Studio 的架构设计严格遵循领域驱动设计(DDD)的核心原则,我们可以看下它的整体项目结构:

├──backend/#后端服务│├──api/#API处理器和路由│├──application/#应用层,组合领域对象和基础设施实现│├──conf/#配置文件│├──crossdomain/#跨领域防腐层│├──domain/#领域层,包含核心业务逻辑│├──infra/#基础设施实现层│├──pkg/#无外部依赖的工具方法│└──types/#类型定义├──common/#公共组件├──docker/#Docker配置├──frontend/#前端应用│├──apps/#应用程序│├──config/#配置文件│├──infra/#基础设施│└──packages/#包├──idl/#接口定义语言文件

我们主要关注backend目录下的内容,从子目录的名称可以很明显看出是 DDD 的分层架构:

  • API 层(api:实现 HTTP 端点,使用 Hertz 服务器处理请求和响应,包含中间件组件;

  • 应用层(application:组合各种领域对象和基础设施实现,提供 API 服务;

  • 领域层(domain:包含核心业务逻辑,定义领域实体和值对象,实现业务规则和工作流;

  • 跨领域防腐层(crossdomain:定义跨领域接口,防止领域间直接依赖;

  • 基础设施层(infra:又分为契约层和实现层;契约层(contract定义所有外部依赖的接口,作为领域逻辑和基础设施之间的边界,包括存储系统、缓存机制、消息队列、配置管理等接口;实现层(impl为契约层定义的接口提供具体的实现;

  • 工具包(pkg:无外部依赖的工具方法,可以被任何层直接使用;

领域驱动设计



领域驱动设计(Domain-Driven Design,简称 DDD)是一种针对复杂业务系统的软件开发方法论,它的核心思想是以业务领域为中心,软件的设计和实现都围绕业务领域的核心概念、规则和流程展开,而非单纯技术架构。通过抽象业务领域中的实体、关系和规则,构建领域模型(Domain Model),并将模型映射为代码,使代码既能反映业务逻辑,又能被业务人员理解。

Eric Evans 在 2004 年出版了《领域驱动设计》一书,提出了经典的 DDD 4 层架构:

我们可以在backend/domain目录下找到 Coze Studio 的所有领域模型:

├──Agent#智能体,只有单智能体├──app#应用├──connector#连接器,ChatSDK或API├──conversation#会话├──datacopy#数据复制任务├──knowledge#知识库├──memory#记忆,包括数据库和变量├──openauth#认证├──permission#权限├──plugin#插件和工具├──prompt#提示词├──search#搜索├──shortcutcmd#快捷指令├──template#模板├──upload#一些默认图标的常量├──user#用户└──workflow#工作流

这里除了领域模型,还定义了对应的实体、值对象、聚合和领域服务等核心领域对象:

  • 实体(Entity):有唯一标识、状态可变的对象,其身份比属性更重要;

  • 值对象(Value Object):无唯一标识、不可变的对象,由属性定义(属性相同则视为相等);

  • 聚合(Aggregate):一组紧密关联的实体和值对象的集合,通过聚合根(Aggregate Root)对外暴露接口,保证数据一致性;

  • 领域服务(Domain Service):封装跨实体/聚合的业务逻辑,无法归属到单个实体时使用;

  • 领域事件(Domain Event):领域中发生的重要事件,用于解耦跨上下文的业务流程;

  • 仓储(Repository):封装数据持久化逻辑,为领域模型提供数据访问接口(屏蔽数据库细节);

  • 限界上下文(Bounded Context):领域模型的边界,每个上下文内有独立的模型和通用语言,上下文间通过接口通信;限界上下文可作为微服务拆分的依据,每个微服务对应一个或多个限界上下文,降低服务间耦合;

在 DDD 开发中,往往还会引入了一个跨领域防腐层(Anti-Corruption Layer,简称 ACL),它通过隔离领域间的直接依赖,防止领域间出现耦合,确保各领域的独立性。Coze Studio 也使用了该设计模式,将跨领域模型定义在backend/crossdomain目录下:

├──contract│├──crossagent│├──crossagentrun│├──crossconnector│├──crossconversation│├──crossdatabase│├──crossdatacopy│├──crossknowledge│├──crossmessage│├──crossplugin│├──crosssearch│├──crossuser│├──crossvariables│└──crossworkflow├──impl│├──...└──workflow├──...

跨领域其实就是对不同领域之间的调用增加了一层适配层,比如会话领域中的agentrun在调用智能体领域时,不是直接调用agent,而是调用防腐层crossagent,这样做的好处是当智能体领域发生变化时,会话领域可以不受影响。

基础设施层



当领域模型构建完成后,接着就可以实现基础设施层,包括实现具体的数据库持久化逻辑,集成外部服务 API 和基础设施,实现消息队列的事件发布和订阅机制等;我们可以在backend/infra目录下看到这些,一般将基础设施层分为契约层和实现层,因为大多数基础设施都有多种不同的实现:

├──contract│├──cache#缓存,默认基于Redis实现│├──chatmodel#对话模型,比如OpenAI、ARK、DeepSeek等│├──coderunner#代码执行器,比如Python、JavaScript等│├──document#文档相关,包括文档解析、文档检索、重排序、图片理解、OCR、NL2SQL等│├──dynconf#动态配置,比如Zookeeper、Etcd、Nacos等│├──embedding#嵌入模型,包括OpenAI、ARK和HTTP三种实现│├──es#Elasticsearch增删改查,针对不同的ES版本有不同的实现│├──eventbus#事件总线,包括Kafka、NSQ、RMQ等实现│├──idgen#ID生成器│├──imagex#火山引擎的veImageX服务│├──messages2query#问题改写│├──modelmgr#模型管理器│├──orm#对象关系映射,默认使用GORM框架│├──rdb#关系型数据库,默认使用MySQL数据库│├──sqlparser#SQL解析器│├──sse#服务器发送事件,默认使用Hertz的SSE实现│└──storage#存储服务,比如Minio、S3、TOS等└──impl├──同契约层

接口层实现



领域层的上面是应用层和接口层。应用层通过组合领域对象和基础设施,实现具体的业务用例;接口层则将具体的业务功能包装成 HTTP 接口,供前端或 SDK 调用。

Coze Studio 使用字节自家开源的Hertz框架来实现接口层。这是一个使用 Golang 编写的 HTTP 框架,具有高易用性、高性能、高扩展性等特点,它的设计参考了fasthttp、gin、echo等开源框架,并结合字节内部的需求,目前在字节内部已被广泛使用。

Hertz 包括服务端和客户端,提供了路由、多协议、多网络库的支持,内置常用中间件,并集成了日志、监控、服务注册发现等三方扩展,框架图如下所示:

为了更好地理解 Coze Studio 的代码,我们不妨快速熟悉下 Hertz 的使用。首先,创建hertz_demo文件夹,然后进入该目录,创建main.go文件,内容如下:

packagemain
import("context"
"github.com/cloudwego/hertz/pkg/app""github.com/cloudwego/hertz/pkg/app/server""github.com/cloudwego/hertz/pkg/common/utils""github.com/cloudwego/hertz/pkg/protocol/consts")
funcmain(){ h := server.Default(server.WithHostPorts(":9999"))
h.GET("/ping",func(ctx context.Context, c *app.RequestContext){ c.JSON(consts.StatusOK, utils.H{"message":"pong"}) })
h.Spin()}

使用go mod init命令生成go.mod文件:

$gomodinithertz_demo

再使用go mod tidy命令整理并拉取依赖:

$gomodtidy

最后使用go run启动服务:

$gorunhertz_demo

如果看到类似下面这样的日志,则说明服务已启动成功:

2025/08/0507:12:36.758686engine.go:681:[Debug]HERTZ:Method=GETabsolutePath=/ping-->handlerName=main.main.func1(num=2handlers)2025/08/0507:12:36.759819engine.go:417:[Info]HERTZ:Usingnetworklibrary=netpoll2025/08/0507:12:36.760315transport.go:149:[Info]HERTZ:HTTPserverlisteningonaddress=[::]:9999

使用curl对接口进行测试:

$curlhttp://localhost:9999/ping{"message":"pong"}

这样一个简单的基于 Hertz 的 Web 服务就开发好了,如果想对 Hertz 做深入学习,可参考官方文档:

  • https://www.cloudwego.io/zh/docs/hertz/getting-started/

hz代码生成



在上面的演示中,我们创建并编写main.go文件是从零开始的,其实,Hertz 还提供了一个hz命令行工具,可以快速生成 Hertz 项目的脚手架。

在安装hz之前,首先确保GOPATH环境变量已经被正确的定义,并且将$GOPATH/bin添加到PATH环境变量之中:

exportGOPATH=$HOME/goexportPATH=$GOPATH/binPATH

然后就可以通过下面的命令安装hz

$goinstallgithub.com/cloudwego/hertz/cmd/hz@latest

运行hz -v验证是否安装成功:

$hz-vhzversionv0.9.7

如果能正常显示版本号,则说明hz已成功安装。接下来,我们使用hz来生成一个 Hertz 项目。首先,创建hz_demo文件夹,然后进入该目录,执行如下命令:

$hznew-modulehz_demo

该命令会生成如下目录结构:

├──biz│├──handler││└──ping.go│└──router│└──register.go├──build.sh├──go.mod├──main.go├──router.go├──router_gen.go└──script└──bootstrap.sh

仔细对比 Coze Studio 的backend目录结构,可以发现两者几无二致,基本上可以确定,Coze Studio 的backend模块也是使用hz自动生成的。

接着安装依赖:

$gomodtidy

并启动服务:

$gorunhz_demo

接口定义语言



hz的另一大特点是,它可以基于接口定义语言(Interface Definition Language,简称 IDL)生成 Hertz 项目的脚手架。IDL 是一种中立的、跨语言的规范,用于描述软件组件之间的接口(如数据结构、函数、服务定义等),它不依赖于特定编程语言,而是通过统一的语法定义接口契约,再由工具生成不同语言的代码(如 C++、Java、Python、Golang 等),在分布式系统中,不同服务可能使用不同语言开发,通过 IDL 可确保数据格式和交互方式一致。

Thrift 和 Protobuf 是两种主流的 IDL 实现,均用于跨语言数据序列化和服务通信,广泛应用于分布式系统:

  • Thrift是由 Facebook 开发的开源 IDL 框架,后捐给 Apache 基金会,支持数据序列化和 RPC 服务开发;

  • Protobuf是 Google 开发的开源 IDL 框架,专注于高效的数据序列化,常与 gRPC 配合实现 RPC 通信;

hz对 Thrift 和 Protobuf 两种 IDL 都提供了支持,但是在使用之前,需要安装相应的编译器:thriftgo或protoc,这里以 Thrift 为例,使用下面的命令安装 thriftgo 编译器:

$GO111MODULE=ongoinstallgithub.com/cloudwego/thriftgo@latest

然后我们创建一个新目录idl_demo,并新建一个idl/hello.thrift文件:

// idl/hello.thriftnamespacegohello.example
structHelloReq{1:stringName(api.query="name");// 添加 api 注解为方便进行参数绑定}
structHelloResp {1:stringRespBody;}
service HelloService {HelloRespHelloMethod(1: HelloReq request) (api.get="/hello");}

这个文件声明了hello.example命名空间,并定义了HelloReqHelloResp两个结构体,分别对应HelloService服务中HelloMethod接口的请求和响应,同时还定义了该接口为 GET 请求,地址为/hello

再通过下面的命令生成项目脚手架:

$hznew-moduleidl_demo\-idlidl/hello.thrift\-handler_dirapi/handler\-router_dirapi/router\-model_dirapi/model

其中-handler_dir-router_dir-model_dir用于将对应的目录生成到api目录下,而不是默认的biz目录,这和 Coze Studio 的代码做法一致。新生成的目录结构如下:

├──api│├──handler││├──hello│││└──example│││└──hello_service.go││└──ping.go│├──model││└──hello││└──example││└──hello.go│└──router│├──hello││└──example││├──hello.go││└──middleware.go│└──register.go├──build.sh├──go.mod├──idl│└──hello.thrift├──main.go├──router.go├──router_gen.go└──script└──bootstrap.sh

HelloService服务的实现位于api/handler目录下,hello/example对应 idl 文件中的命名空间,我们可以打开hello_service.go对其进行编辑:

// HelloMethod .// @router /hello [GET]funcHelloMethod(ctx context.Context, c *app.RequestContext){varerrerrorvarreq example.HelloReq err = c.BindAndValidate(&req)iferr !=nil{  c.String(consts.StatusBadRequest, err.Error()) return }
resp :=new(example.HelloResp) resp.RespBody ="hello, "+ req.Name // <-- 新增代码 c.JSON(consts.StatusOK, resp)}

接着和上面一样,安装依赖,启动服务:

$gomodtidy$gorunhz_demo

使用curl验证通过 IDL 定义的/hello接口是否能正常调用:

$curl"http://localhost:9999/hello?name=zhangsan"{"RespBody":"hello,zhangsan"}

Coze Studio 的源码中有一个idl目录,里面包含大量的 Thrift 文件,定义了平台所有接口和结构体,backend/api目录下的handlerroutermodel就是基于这些 IDL 通过hz自动生成的。

小结



今天,我们对 Coze Studio 的代码架构做了一番研究。首先学习了其基于领域驱动设计(DDD)的后端实现,掌握了领域层、跨领域防腐层、基础设施层等概念;然后通过实践 Hertz 框架、hz命令行工具以及接口定义语言(IDL),理解了其 API 层的构建方式。通过今天的学习,相信大家对 Cozs Studio 的代码全貌有了一个直观的了解,在阅读 Coze Studio 源码时不至于迷路。

接下来,我们就深入到具体的业务实现里,看看它的智能体、插件、工作流、知识库以及记忆等核心功能是如何实现的。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ