大模型生成其实也比较简单,就是根据用户的要求和案例,来生成符合用户目标的内容,比如说文字生成,图像生成,视频生成等等。
而从技术上来说,大模型内容生成核心主要由两个,一个是大模型本身的能力,这个就是上面大模型技术需要解决的问题;第二个就是提示词,用来激发大模型的潜力,让大模型生成更好更符合用户目标的高质量内容。
比如说小参数模型一般情况下没有大参数模型的生成效果好。
大模型增强
RAG检索增强是为了解决大模型的天生缺陷,因为大模型的知识和能力并不是实时更新的,每次都需要进行重新训练或微调;而且大模型还存在一定的幻觉,因此需要通过外部知识增强的方式,让大模型能够处理实时性数据和减少幻觉问题。
大模型扩展-Agent
之所以叫大模型扩展的原因就是因为大模型虽然有推理和思考以及生成的能力,但大模型有一个很大的缺陷就是无法使用外部工具;但在具体的应用场景中,很多事情是需要借助外部工具来实现的,比如说你饿了点外卖需要借助外卖平台。
大模型同样如此,虽然现在随着大模型能力的增强,它具备了基本的思考和规划能力;但它依然无法使用外部工具,所以通过Agent也就是智能体技术来给大模型安装手和脚,让它能够使用外部工具来更好更高效的解决问题。
比如说让大模型帮你制定一个旅行路线,那么它就可以通过自主规划,去设计路线,然后通过第三方平台订票,订房,订车等等。
开发工具
前面说了大模型技术和大模型应用技术的基本理论,而这些技术又有哪些具体的开发框架和工具呢?
大模型技术开发目前市面上有很多开发框架,因为大模型行业标准还没有完全定性,各家模型公司都想抢着占领制高点制定行业规则;但目前来看还处于百家争鸣的时代。
而目前从技术开发上来说,大模型技术开发主要有Meta开发的pytorch开发框架和谷歌的Tensorflow框架;当然还包括其它一些开发框架,感兴趣的可以自己去了解。
而从技术理论上来说,有影响最大的Transformer架构和比较经典的RNN,CNN,Gan生成对抗网络等;包括国内DeepSeek提出的MoE专家模型等。
当然,现在更加主流的开发方式是把多种模型架构相结合,在不同的地方使用不同的架构。
而大家在学习的时候应该选择其中一种框架和架构进行学习,当你学会其中一种架构之后,其它的就能一法通万法通了。
大模型应用技术的开发工具
关于大模型应用技术的开发就更加复杂了,不同的协议和技术不断被提出;比如说openAI公司提出的Function call,现在比较火的MCP协议,以及谷歌提出的A2A协议等Agent开发协议。
而关于RAG检索增强也经过多个版本的迭代:
基础阶段(Naive RAG)
高级阶段(Advanced RAG)
模块化阶段(Modular RAG)
智能体RAG (Agentic RAG)
总之,大模型技术和大模型应用技术的发展还处于一个快速迭代和验证的过程;而想从事大模型领域的人,应该尽快选择其中的一个细分领域作为切入点;然后根据自己能力和兴趣选择合适的方向。