1. DeepSeek 是什么
DeepSeek,是一家在2023年于杭州成立的AI公司「深度求索」开发的大模型名称。DeepSeek 发展情况如下: - 2024年1月,发布「DeepSeek LLM」,这是他们正式发布的第一版DeepSeek 大模型。
- 2024年5月,发布「DeepSeek-V2」,正式打响中国大模型价格战,当时新发布的 DeepSeek-V2 的API价格只有 GPT-4o 的 2.7%,随后一周时间,国产厂商全部跟进,字节、阿里、百度、腾讯全部降价。
- 2024年12月,发布「DeepSeek-V3」且开源,训练成本仅为557.6万美元,剔除掉Meta、OpenAI等大厂的前期探索成本,大概是别人的三分之一,并且整体模型评测能力媲美闭源模型,震惊海外,自此,东方的神秘力量彻底坐实。
- 2025年1月,发布全新的推理模型DeepSeek-R1 且开源,效果媲美业界标杆OpenAI o1,同时API价格仅为OpenAI o1的3.7%,再一次震惊海外,让Meta连夜成立四个研究小组,让全球算力暴跌,英伟达的神话都岌岌可危。
接下来,我们就看看火遍全球的DeepSeek-R1 大模型到底应该怎么用。 2. DeepSeek-R1核心使用技巧2.1 总体原则(建议优先阅读)- 自然对话优先
- 目标导向沟通
- 动态难度调节
- 专业深度可选
下文将具体展开每个原则的实践方法。 2.2 核心技巧一:摒弃结构化模板原理说明 作为专精推理的大模型,DeepSeek-R1内置完整的思考链条。传统提示词工程中的分步指令(如”请按以下步骤分析…”)反而会限制其推理能力的发挥。 对比案例 作为新能源行业分析师,请按以下结构撰写报告: - 技术路线(800字)
要求:引用2024年最新数据…
下周要与比亚迪电池供应商谈判,需要:
效果差异:前者产出标准化报告,后者生成包含价格锚定策略的实战指南。 2.3 核心技巧二:目标场景描述法操作公式 [身份背景]+[使用场景]+[核心目标]+[特别关注点] 应用示例 - 基础版:”我要给高中生讲解量子力学,需要三个生活化比喻”
- 进阶版:”作为医疗器械销售,需要准备与三甲医院主任的会谈资料,重点突出我们的耗材在手术室场景下的感染防控优势”
2.4 核心技巧三:动态难度调节当遇到晦涩难懂的回复时,可通过以下方式优化: - 即时修正
- 预设条件
- 渐进升级
3. 不同用户的使用建议4. 结语:让技术回归服务本质DeepSeek-R1的技术突破,本质上是对AI服务本质的回归——当大模型足够理解人类意图时,我们不再需要学习”与机器对话的特殊语言”。这种转变正如智能手机取代命令行:技术进化的终极目标,是让复杂消失于无形。
|