DeepSeek:深度思考与“开源之光”DeepSeek是“后GPT时代”两个关键词的代表性案例。对于DeepSeek-R1的基座模型DeepSeek-R1-Zero而言,在强化学习训练阶段,随着训练阶段的递进,模型平均响应长度在稳定变长,DeepSeek-R1-Zero自主学习到使用更长的思考时间来解决推理任务(“DeepSeek-R1-Zero naturally learns to solve reasoning tasks with more thinking time”)。此外,DeepSeek-R1-Zero还出现了“aha moment”,也即DeepSeek-R1-Zero学会了通过重新评估其初始解决方案,以分配更多的思维时间解决问题。后训练的魅力时刻在这里充分显露出来。
Dify:DeepSeek-Researcher相比于扣子补充的“最后一公里”,开源的Dify平台更好地匹配了机构内部部署的需求。Dify平台由苏州语灵人工智能科技有限公司开发,作为一款开源的LLMOps(Large Language Model Operations,大语言模型运维)平台,Dify能够帮助用户快速创建可视化、可运营的AI应用。Dify的本地部署可参考华泰金工前期报告《大模型本地部署手册》(20241007)。 Dify平台提供了丰富且专业的大模型应用模板,我们以“GPT-Reasearcher EN”为模板,尝试构建一个DeepSeek-Researcher应用,主要功能是围绕特定主题生成研究报告。该应用接受研究主题为输入,如“DeepSeek+投研=?”,从主题中提取、扩充关键词用于互联网资料检索,随后由检索工具(TavilySearch)反馈检索结果给后续的大模型,最终基于模板生成完整的研究报告。