DeepSeek-R1发布后展现出优秀的推理能力和强大的开源生态优势,对此OpenAI在没有提供证据的情况下,指责称DeepSeek在未经其许可的情况下使用模型蒸馏技术“复制”了OpenAI的模型并与其展开“不正当竞争”,这也引起了关于模型蒸馏是否侵犯版权和商业秘密等讨论。
模型蒸馏是成熟的模型压缩和知识迁移技术,通过将大参数教师模型的知识和推理能力转移到小参数学生模型,在不降低模型能力的情况下大幅扩展了模型的适用环境,其核心技术是通过合成数据让学生模型学习到教师模型的输出结果的概率分布,DeepSeek则进一步利用合成数据技术,通过数据增强合成并优化了具有推导过程的思维链语料,使学生模型具备相似的推理能力,从“知识迁移”演进为“能力转移”。
基于上述技术特征,对模型蒸馏的三项法律指责均难以成立。其一,模型蒸馏过程中生成的合成数据不是生成人类可以理解的内容的过程,不构成版权作品意义上的独创性表达。其二,模型蒸馏是一个开放化、合作性的工程过程,即便是OpenAI这样的闭源模型提供者依然支持模型蒸馏,不会以商业秘密为由限制模型蒸馏等二次利用。其三,利用教师模型蒸馏学生模型是互补性的技术创新,并不是对教师模型的市场替代或恶意干扰,不属于不正当竞争行为。
在人工智能持续突破的当下,坚持开源开放降低人工智能技术门槛、推动生态发展促进应用扩散,对于人工智能发展和创新具有重要意义。对于技术的治理应充分认识人工智能技术-社会系统的复杂性,坚持长期主义、积累公共知识、包容创新鼓励试错。
2025年1月20日,DeepSeek发布推理模型 DeepSeek-R1,其性能在多项指标上与OpenAI的推理模型o1不相上下,并采用最低限制的MIT开源协议将其模型进行了开源公开。1月29日,OpenAI通过《金融时报》等媒体指控DeepSeek利用其专有模型来训练自己的开源竞争模型,认为可能构成知识产权侵权。具体而言,OpenAI自称已有证据证明DeepSeek采用了蒸馏技术来进行上述操作,即通过使用更大、更强大的模型的输出来训练较小模型,使小模型能够以更低的成本在特定任务上实现类似的表现。OpenAI认为蒸馏技术是人工智能行业常用的技术实践,但问题在于DeepSeek可能在未经OpenAI授权的情况下,利用这种技术构建自己的竞争模型,这违反了OpenAI的商业条款——要求用户不得“复制”其任何服务,也不得“利用其模型输出来开发与OpenAI竞争的模型”[1]。美国总统特朗普的人工智能顾问大卫·萨克斯则表示,有大量证据表明DeepSeek通过蒸馏技术从OpenAI模型中提取了“知识”(Knowledge)。据外媒报道,OpenAI及其合作伙伴微软已在去年对据信属于DeepSeek的、使用OpenAI API的账户进行了调查,并以涉嫌违反服务条款为由阻止了其访问。[2]
然而在公开指控之后,OpenAI没有进一步采取措施开展实质的调查或诉讼,也拒绝回答或提供更细节的证据资料,但该事件却引发了国内对于模型蒸馏知识产权问题的讨论。有部分观点认为模型蒸馏技术可能构成对闭源模型的商业秘密侵权,或认为闭源模型的输出可能具有可版权性,模型蒸馏存在版权侵权的风险。
本文以下简要分析模型蒸馏的技术特征,从版权、商业秘密、不正当竞争三个方面否定OpenAI针对模型蒸馏的不合理指控,并对开源开放的人工智能发展生态提出政策建议。
二、模型蒸馏的技术特点以及DeepSeek的创新
三、模型蒸馏无需受到法律限制的三个理由
四、构建促进人工智能技术开放创新的政策环境
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |