链载Ai

标题: OpenAI直播第二天，几十条数据就能训出领域专家，强化微调加速垂域大模型落地 [打印本页]

作者: 链载Ai 时间: 昨天 11:59
标题: OpenAI直播第二天，几十条数据就能训出领域专家，强化微调加速垂域大模型落地

OpenAI 直播第二天发布"强化微调"(Reinforcement Fine-Tuning)功能，这一功能让 AI 训练迎来重大变革：仅需几十到数千条高质量数据，即可获得专业领域的 AI 模型。

最引人注目的是其惊人的效果提升：

OpenAI CEO 奥特曼称其为"2024 年最大惊喜"。但现场未见奥特曼出席，由三位 OpenAI 研究员与伯克利实验室计算生物学家 Justin Reese 进行了实际应用演示。以遗传病诊断为例：

该技术结合了监督微调(SFT)和强化学习(RL)的优势：

值得一提的是，这一技术理念最早出现在字节跳动发表于 ACL 2024 的论文(REFT: Reasoning with REinforced Fine-Tuning)中, OpenAI 在此基础上实现了突破性的工程化应用。

OpenAI 已在生物化学、法律、医疗等多个领域完成内测验证，计划 2025 年春季，面向企业、高校和研究机构开放申请测试资格

强化微调将加速 AI 在垂直领域的应用。它不仅降低了数据需求和计算资源门槛，更为各行业打造专属 AI 模型提供了可能。

另外，在社交媒体上，当被问及大家关心的视频生成模型 Sora 是否发布时，奥特曼的模糊确认，好戏还在后面。

欢迎光临链载Ai (https://www.lianzai.com/)