返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

有了这个大模型,真正的智能运维AIOps时代即将来临

[复制链接]
链载Ai 显示全部楼层 发表于 3 小时前 |阅读模式 打印 上一主题 下一主题

8月26日国务院发文《关于深入实施人工智能+行动的意见》,制定了未来10年人工智能发展的规划!这足以看到国家对AI技术的重视。这也意味着,AI领域即将迎来高速发展,无论是就业机会还是创业机会甚至投资机会都会变得越来越多!兄弟们,冲啊!

而作为一个资深运维老兵,运维领域也是我一直关注的方向。这不,最近发现一个运维领域的垂直大模型--智域。所以,我们离真正的智能运维时代越来越近了!
其实,大模型与智能体在根因分析、异常检测、风险预判等场景表现非常突出。然而通用大模型回答精准度不足、方案可执行性弱、场景适配性差,整体表现欠佳。所以,在此背景下,“稳定性保障实验室”基于SRE领域研究积累,推出了SRE大模型“智域”,助力智能运维建设,推动科技赋能稳定性保障。
智域大模型概述

【模型尺寸】32B

【训练阶段】增量预训练 + 后训练

【亮点】

  • 领域知识学习
    • 领域公开知识
    • 人工运维经验
    • 通用组件文档
    • 真实故障案例
  • 专业技能增强
    • 运维流程与工具使用学习(如故障排查)
    • SRE专业技能增强(如SQL/PromQL生成)
    • RAG确定性增强
智域大模型数据构建来源
  • 领域公开知识:SRE领域公开书籍、论文、行业报告、白皮书等, 如《SRE实践白皮书》
  • 人工运维经验:稳定性保障实验室参与企业SRE专家提供的高质量运维经验数据,主要面向故障诊断过程
  • 通用组件文档:通用组件的使用、运维文档,以强化大模型对于组件(尤其是国产化组件)的使用和维护能力
  • 真实故障案例:包含故障概要、业务背景、故障轨迹、根因分析、处置动作、优化方案 6个内容版块的高质量故障数据
  • 运维平台提取:企业运维平台提取的真实操作类数据,以提供大模型学习SRE的工作流程、工具使用规范
  • 强化学习生成:构建SRE专项能力(如故障排查)的模拟环境,在环境中强化学习的过程中,生成高质量训练数据
智域大模型训练过程
模型训练基于Qwen3-32B模型,分为增量预训练、微调与强化学习后训练共3个阶段。 通过增量预训练与监督微调完成领域知识学习,通过微调与强化学习完成领域专业技能训练,最后通过强化学习DPO完成关键通用能力的提升。
智域大模型评估
模型
人工运维经验
领域公开知识
通用组件文档
SRE专业技能
Qwen3-32B
0.7432
0.8047
0.8273
0.4950
zhiyu
0.8468
0.8712
0.8789
0.5443
当然,这个评分只能说凑合,离优秀还是有差距的。智域大模型还有很长的路要走。但我相信,随着越来越多的开发者或爱好者的参与和贡献,智域会变得越来越强大!我们拭目以待吧!
最后介绍下我的大模型课:我的运维大模型课上线了,目前还在预售期,有很大优惠。AI越来越成熟了,大模型技术需求量也越来越多了,至少我觉得这个方向要比传统的后端开发、前端开发、测试、运维等方向的机会更大,而且一点都不卷!

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ