|
智东西2月16日报道,杭州深度求索公司DeepSeek的爆火,用开源逼得一众头部大模型同行紧急调整战略布局。百度、阿里、腾讯、网易把旗下多款国民级产品接入DeepSeek,抖音集团猛推火山引擎和飞书,“大模型六小虎”的3家都将自家产品接入DeepSeek。仅是这3天,就有腾讯、百度、网易3家大厂连番追加新动作: “大模型六小虎”中有3家独角兽已积极拥抱DeepSeek:零一万物、MiniMax分别在海外版产品中接入DeepSeek R1,阶跃星辰则率先将其国内拳头AI产品跃问接入DeepSeek R1。目前腾讯的ima.copilot、QQ音乐、腾讯元宝、微信、QQ浏览器、腾讯文档、腾讯云AI代码助手、腾讯元器、腾讯乐享、腾讯地图,百度的文小言、Apollo自动驾驶、百度地图、百度搜索、文心智能体平台以及百度智能云旗下客悦、曦灵、一见、甄知,阿里的通义灵码、钉钉,蚂蚁的支付宝百宝箱,字节的飞书,360的纳米AI搜索,网易的有道词典、《逆水寒》手游,这些产品都接入了DeepSeek。与DeepSeek不构成直接竞品关系的手机品牌,更是无所顾虑地在自家AI助手中提供DeepSeek模型选项。八大手机品牌华为、荣耀、OPPO、vivo、魅族、努比亚、红魔、联想摩托罗拉,均已宣布将AI助手接入DeepSeek-R1。小米也在2月14日被曝对小米澎湃OS2的超级小爱说“打开深度思考”能使用DeepSeek-R1,而后该功能暂时下线。 有意思的是,尽管DeepSeek-R1在业界搅起腥风血雨,但至今DeepSeek官方公众号置顶的精选文章还是11月20日的DeepSeek-R1-Lite预览版和12月26日发布的DeepSeek-V3。彻底引起全球大模型产业巨震的“导火索”,是1月20日正式发布的大招——DeepSeek-R1性能对标OpenAI o1正式版+开源模型权重+开放思维链输出+网页版和App免费可用+API每百万tokens输入只要1块钱+论文训练技术全部公开。在被聚光灯对准的这些天,DeepSeek一直保持低调,除了1月27日发布春节AI贺词文章、1月28日开源多模态统一理解生成模型Janus-Pro外,就只在2月6日更新过一篇打假仿冒账号的《关于DeepSeek官方信息发布及服务渠道的说明》文章。 2月7日~11日,DeepSeek招聘页面发布多个社招岗位信息,包括深度学习研究员等【急】、核心系统研发工程师【急】、全栈开发工程师【急】、深度学习研发工程师【急】、数据百晓生、高级运维开发工程师、高级技术专家(50-100K/月等)、数据中心技术主管、资深系统运维工程师、招聘经理(20-60K/月)、高级数据采集工程师(25-50K/月)、AGI法务等。 人事变动方面,企业信用查询平台企查查显示,2月15日,DeepSeek关联公司深度求索发生工商变更,裴湉由执行董事兼总经理改任经理、董事,新增王贤祖为财务负责人,同时经营范围新增互联网信息服务。 面对DeepSeek的强势崛起,其他大模型同行则恐怕度过了一个极其难忘的春节和节后开工。下面,我们来回顾下从1月20日DeepSeek-R1横空出世至今,这四周,国内主流基础大语言模型供应商们都做了哪些事(括号内是这些企业的自研大模型名字)。
春节前,MiniMax、阶跃星辰、月之暗面、百川智能均发布了新模型,而且后三家都发布了推理模型。节后,“大模型六小虎”动向各不相同,阶跃星辰最先在国内产品中接入DeepSeek,零一万物、MiniMax则在海外版产品中上新DeepSeek。其中阶跃星辰、MiniMax都在主攻多模态,零一万物今年将重心转向轻量化模型和AI-First应用,因此与DeepSeek并未构成强竞争关系。另外三家中,智谱忙着发布面向AI PC和智能手机的To B智能体合作,百川智能专注于做医疗模型和产品。去年在Kimi上大举投流的月之暗面,则在今天才发表蛇年的首篇公众号文章。据虎嗅2月15日报道,月之暗面内部已将“持续拿到SOTA结果”确定为当下最重要的工作目标。此外,有自研基础大模型的移动互联网独角兽APUS麒麟合盛也已宣布接入DeepSeek。1月20日,发布极速响应、高性价比的轻量级推理模型Step-2 mini,以及专为创作而生的Step-2文学大师版。Step-2文学大师版已上线跃问App,网页端在官宣当周全量上线。1月21日,宣布多模态理解大模型Step-1o Vision上线,语音模型Step-1o Audio能力升级。两款模型均在跃问网页版和App全量开放。1月22日,发布视频生成模型Step-Video V2版本,支持在跃问网页端申请试用。1月24日,宣布推出“跃问AI创意板”,在跃问最新版本上线,支持0代码基础、3步开发应用。2月16日前,阶跃星辰跃问网页版接入DeepSeek,可免费体验,支持深度思考、搜索、上传文件。 1月20日,宣布全新升级的T2A-01系列语音模型,全球同步上线海螺语音产品,预置不同语种共计300+音色,支持自定义音色的通透性、力度以及叠加回声、广播、失真、电音等特殊效果。2月16日,宣布海外网页版MiniMax Chat已接入DeepSeek R1,限时免费体验,暂不支持联网搜索(选MiniMax-Text-01是支持联网搜索的)。 1月23日,发布2024年终总结,宣布将聚焦轻量化模型,加速AI-First应用探索,积极拥抱应用、穿透产业。2月7日,发布人民日报专访零一万物CEO李开复博士的文章,强调2025年将会是AI-First应用爆发的元年。2月12日,宣布海外版产品PopAi接入DeepSeek R1模型,提供深度思考和联网功能,网页版和App均已上线。 2月14日,宣布零一万物与苏州高新区联合成立的产业大模型基地正式授牌。该基地将作为聚焦垂直产业的大模型基地,重点打造制造、金融、医疗、政务等多个领域的行业大模型解决方案。2月15日,宣布在官网上推出DeepSeek APUS加强版大模型。此版本以满血版DeepSeek R1大模型为基础,从“能用、会用、好用”三个方面进行全面优化与提升。 1月21日,宣布清影2.0现已在智谱清言全量上线,带来更强的视频生成能力。普通用户可以智谱清言上免费试用,会员享受快速通道(不扣积分的无限模式)。1月23日,宣布首个面向公众、回车即用的电脑智能体(agent)GLM-PC开放体验,最新推出「深度思考」模式,并增加了专用来做逻辑推理和代码生成的功能,也提供了对Windows系统的支持。智谱正与联想、华硕等PC厂商展开深度合作探讨,推动AI PC创新与发展。2月11日,宣布和三星基于Agentic GLM展开合作,将Agent体验带到三星最新手机Galaxy S25系列上。2月11日,发布一则1月23日的旧新闻:智谱CEO张鹏出席中国银行《支持人工智能产业链发展行动方案》发布活动并发表致辞;智谱是中国银行总行的智能化场景建设合作伙伴,并与中行北京分行紧密合作。1月24日,发布全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B。1月26日,宣布开源全模态理解生成统一模型Baichuan-Omni-1.5上线,并开源两个评测集OpenMM-Medical、OpenAudioBench。2月14日,宣布首个AI儿科医生正式“上岗”:国家儿童医学中心首都医科大学附属北京儿童医院在2月13日开展了国内首次“AI儿科医生+多学科专家”的双医并行多学科会诊,引入了由北京儿童医院与百川智能、小儿方健康科技联合研发的以Baichuan M1大模型为底座打造的“AI儿科医生”。1月20日,发布全新SOTA模型k1.5多模态思考模型,声称k1.5“应该是全球范围内,OpenAI之外的公司首次实现o1正式版的多模态推理性能”,首次公开模型训练技术报告,宣布预览版将陆续灰度上线网页版和最新版App。1月21日,宣布Kimi智能助手上线《2024年度认知天赋报告》。1月26日,分享一些用户使用Kimi的年度故事,公布Kimi交互成绩单(2024年给出了40亿个问题的答案)。1月31日,宣布Kimi智能助手最新版iOS和Android应用、网页版上线k1.5。2月17日,公众号发文分享月之暗面研究员Flood Sung在知乎上回答的k1.5模型背后的完整思考过程。
科技巨头个个是狠角色,优势在于独立业务多,不用太在意自家大模型团队的感受。关键看谁能抢占发挥自家优势,抓住先机争取到更多的用户和收入。接入DeepSeek的核心业务分为两大块,一块侧重提供算力+模型开发服务,另一块侧重应用。在2月13日举行的全员会上,字节CEO梁汝波反思与创业公司相比,字节跳动在对待大模型新机会时的敏感度明显不足,提出今年字节在AI领域的重点目标包括追求“智能”上限、探索新的交互和加强规模效应,认为相比追求某个具体产品,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点。云服务方面,华为云打响DeepSeek上云第一枪,腾讯云、百度智能云、阿里云、火山引擎、浪潮云等纷纷跟上。蚂蚁亦宣布支付宝百宝箱支持用DeepSeek构建智能体。应用方面,腾讯、360分别都将自家AI大模型产品腾讯元宝、纳米AI接入满血版DeepSeek-R1。百度文小言则含蓄一些,没有直接提供替换文心大模型的选项,只是将R1模型用于优化拍照解题功能。QQ音乐、QQ浏览器、腾讯地图、百度地图、网易有道词典等国民级应用都接入DeepSeek了,全国TOP1月活的微信也刚刚开启DeepSeek灰度测试,不知道网易云音乐、百度浏览器、高德地图、QQ等应用会不会很快跟上。一些拥有自研大语言模型的手机巨头,包括荣耀、OPPO、vivo、中兴(努比亚和红魔)、联想摩托罗拉,都已将AI助手接入DeepSeek。由于大厂更新消息实在太密集,这里仅梳理了它们在大模型方面的相关动作,不涉及它们分享的教程及合作伙伴案例。2月11日,宣布最少仅需3行代码,开发者就能将满血版DeepSeek接入微信小程序里,云开发新用户还享有首月套餐免费和100万token的福利。 2月17日,宣布腾讯云AI代码助手、腾讯元器、腾讯乐享、腾讯地图,组团接入DeepSeek。腾讯云AI代码助手、腾讯元器全免费、不限量开放;腾讯乐享AI助手将全量免费开放基于DeepSeek模型的服务;腾讯地图率先将DeepSeek-R1能力与“地点提取”功能融合,支持用户一键生成、查询旅游攻略等。
2月13日,宣布正式上线满血版DeepSeek,助力网易数智旗下网易数帆有数ChatBI、网易易盾、网易CodeWave、网易云信及网易云商等多业务全面接入DeepSeek,同时开放网易伏羲自研MoA专家协作智能体。 2月17日,宣布在网易伏羲【有灵·易生诸相】平台的助力下,以官方版本DeepSeek驱动的智能NPC“沈秋索”即将正式踏足《逆水寒》手游的江湖。这是DeepSeek首次进入游戏、首次拥有虚拟形象、首次成为虚拟智慧生命体。
其他拥有自研基础大模型的上市公司中,科大讯飞、商汤科技主要通过MaaS模式来提供DeepSeek模型服务,昆仑万维、出门问问、知乎将DeepSeek接入了自家产品,云天励飞、云从科技均宣布训推一体机成功适配DeepSeek。2月10日,宣布DeepSeek全系大模型正式上线讯飞开放平台,支持公有云API调用、一键部署专属模型,即日起至3月10日DeepSeek推理API免费开放。1月20日,宣布商汤科技日日新融合大模型交互版(SenseNova-5o)正式对外提供实时音视频对话服务,限时免费使用。1月22日,宣布商汤“秒画趣拍”App上线,首次登陆即获得500点永久点数。1月26日,宣布商汤日日新融合大模型交互版(SenseNova-5o)在实时音视频中文测评基准SuperCLUE-Live首测榜单中以总分68.59排名国内第一。2月7日,宣布与广东移动联合体中标广州越秀企业集团“AI中台大模型能力建设项目”。2月8日,宣布商汤大装置上架DeepSeek系列模型,企业客户和开发者可享受3个月内1000万tokens免费使用权益。2月8日,宣布天工AI PC版更新,上线“DeepSeek R1 + 联网搜索”功能。 2月14日,推出Matrix-Zero世界模型,称昆仑万维成为中国第一家同时推出3D场景生成、可交互视频生成模型的探索空间智能的企业。2月15日,宣布在天工AI在第三方AI评测机构SuperCLUE发布的《DeepSeek-R1网页端稳定性测评报告》中取得了总榜排名第二、完整回复率排名第二、准确率排名第二的成绩。2月7日,宣布率先完成与DeepSeek-R1的深度适配,并将其先进能力融于公司旗下全线AIGC产品。2月11日,宣布知乎AI搜索产品知乎直答正式接入满血版DeepSeek R1,在知乎直达网页和知乎App双端集成上线。 2月5日,宣布云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1 1.5B、7B、8B蒸馏模型的适配,R1 32B蒸馏模型及V3/R1 671B MoE大模型也在有序适配中。适配完成后,DeepEdge10将在端、边、云全面支持DeepSeek全系列模型。2月14日,宣布云天励飞训推一体机成功适配DeepSeek,并在深圳龙岗、南山等地上线。2月10日,宣布联合众数信科推出首款DeepSeek端侧办公设备众寻AI鼠标。2月13日,宣布云从科技从容大模型训推一体机成功适配DeepSeek,可实现开箱即用的私有化部署。2月13日,宣布寻知AI·智能体一体机适配国产算力,预装DeepSeek等主流大模型,AI智能体平台开箱即用。
DeepSeek的大语言模型同行们,有的顺势而为,有的按兵不动,有的大举接入,有的卷生卷死。阶跃星辰、腾讯、360均在自家AI大模型产品中加上了DeepSeek R1深度思考+联网搜索选项,阿里和豆包的自家模型更新最勤,腾讯、百度有来自不同业务的多款产品接入DeepSeek,百度还宣布将免费开放文心一言、开源文心大模型4.5。去年卷投流最猛的Kimi和豆包两家,高层似乎都将取得最佳模型性能视作今年的重心,大有要在模型上与DeepSeek一较高下的架势。周末,两大掌握巨量流量入口的微信、百度搜索接入DeepSeek,震动整个市场。而阿里、字节在产品接入方面的出手相对收敛,最先拥抱DeepSeek的是云服务和协同办公软件,阿里的淘宝、支付宝、高德以及字节的抖音,这些掌握高月活的超级App均未宣布全面接入DeepSeek。接下来,“大模型六小虎”会如何讲好新故事?下一个将DeepSeek上架的产品,又会来自哪家大模型供应商呢?
|