OpenAI开源的GPT-OSS-Safeguard-120B 和 GPT-OSS-Safeguard-20B 是基于 GPT-OSS 构建的安全推理模型。使用这些模型,您可以根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务。这些模型主要用于安全用例。对于其他应用,我们建议使用 GPT-OSS 模型。GPT-OSS-Safeguard-20B(210 亿参数,其中 36 亿为活跃参数)可以适配具有 16GB 显存的 GPU。如果您需要更大的模型,可以查看GPT-OSS-Safeguard-120B(1170 亿参数,其中 51 亿为活跃参数)。
亮点:
ingFang SC", "Source Han Sans SC", "Microsoft YaHei UI", "Microsoft YaHei", "Noto Sans CJK SC", sans-serif;scrollbar-color: transparent transparent;margin: 0px;padding: 0px 0px 0px 24px;border: 0px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-variant-numeric: inherit;font-variant-east-asian: inherit;font-variant-alternates: inherit;font-variant-position: inherit;font-variant-emoji: inherit;font-weight: 400;font-stretch: inherit;font-size: 14px;line-height: inherit;font-optical-sizing: inherit;font-size-adjust: inherit;font-kerning: inherit;font-feature-settings: inherit;font-variation-settings: inherit;vertical-align: baseline;list-style: disc;color: rgba(0, 0, 0, 0.9);letter-spacing: 0.5px;orphans: 2;text-align: start;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;" class="list-paddingleft-1">安全推理训练:专门针对安全推理进行训练和调整,以满足诸如 LLM 输入输出过滤、在线内容标记以及信任与安全用例的离线标记等使用场景。
自带策略:能够解读您书写的策略,从而在不同产品和使用场景中实现通用化,且几乎无需工程干预。
推理决策,而不仅仅是分数:您可以完全访问模型的推理过程,这有助于更轻松地调试并增强对策略决策的信任。请注意,原始 CoT(链式推理)是为开发人员和安全从业者设计的,不建议将其暴露给普通用户或用于安全上下文之外的用例。
可配置的推理强度:根据您的具体使用场景和延迟需求,轻松调整推理强度(低、中、高)。
宽松的 Apache 2.0 许可证:自由构建,无需担心版权共享限制或专利风险——非常适合实验、定制以及商业部署。