链载Ai

标题: 回应DeepSeek抄袭的质疑,DeepSeek和OpenAI ChatGPT的比较 [打印本页]

作者: 链载Ai    时间: 昨天 17:08
标题: 回应DeepSeek抄袭的质疑,DeepSeek和OpenAI ChatGPT的比较


先直接回答质疑

质疑1:DeepSeek是通过OpenAI的API进行训练的,盗取了OpenAI的数据

回答:不是,DeepSeek训练是采用了开源大模型的数据,并进行RL自对齐自学习进行训练。假如通过API调用获取的数据,因为存在幻觉,会有很多不可靠的结果,并不会让大模型变得更加聪明。

质疑2:DeepSeek是采用5万张偷运显卡进行训练的,存在着显卡欺骗行为

回答:技术论文已经发表了,相关模型也开源了,论文也发布了,技术专家都在学习,应该过不了多久就会出现不少复制的产品。到时候业界的大模型训练速度由过去的一年提升到2个月以内,甚至显卡多的可以半个月发布一个大版本,将会改写大模型更新慢,推理慢的现状,到时候大家要感谢DeepSeek的贡献,将模型训练推进到一个新的高度。

质疑3:DeepSeek是过于夸大了,没有多大的创新

回答:DeepSeek的创新是颠覆性的,是OpenAI发布ChatGPT后的重要事件,将影响到大模型今后的发展,颠覆产业格局,让开源大模型接近头部的大模型公司,并超越了很多商业化的闭源大模型企业,并建立开源的产业生态。DeepSeek的FP8训练优化,以及今后在推理端兼容多种芯片的格局会出现,从而将成本降低数倍,这是历史性突破。并能够基于DeepSeek生态发展,从软件方向驱动突破技术封锁等问题。

以下是通过技术论文,给大家科普的DeepSeek和OpenAI的不同和创新,介绍DeepSeek V3 和DeepSeek R1两个版本和OpenAI的不同,并解析数据如何训练的。

与OpenAI核心技术对比

  1. 混合专家模型(MoE)






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5