|
AI 通常怎么错
当你问 AI 一个问题,如:「今年诺贝尔物理学奖获得者 其中年轻的那位的出生地的今日天气」 通常情况下,AI 会给出错误答案,比如下面这个 
很显然:这个答案是错的。实际上,AI 只检索到了获奖者的出生地,而天气纯靠猜。
AI 为何会犯错
看过之前文章(看完这篇,你也能做 AI 搜索:论「结构化输出」)的朋友都知道,AI 搜索实际上包含以下的固定流程:
而在上面的例子中,细细分析请求步骤,如下:

AI 如何纠错
但实际上,我们期待一种怎样的 AI 搜索呢? 联网搜索,并支持多步检索(比如智谱清言里的这个智能体) https://chatglm.cn/main/gdetail/659e54b1b8006379b4b2abd6?lang=zh 
这时候我们看到,搜索的路径变了,成了: 任务规划:将用户的提问,一个思考框架:如需解决某一问题,应步骤一、二、三、四... 任务执行:每一具体步骤,需分别获得哪些信息(将重复多次): 意图识别:将步骤任务,转化成搜索任务 搜集信息:通过搜索引擎,尝试搜集相关信息 反思&调整后续:判定当前任务是否完成 如完成:继续后面步骤 如无法完成:换一种方式尝试完成
整合回答:将找到的信息,连同用户的提问,一起返回给用户
具象一点,在「今年诺贝尔物理学奖获得者 其中年轻的那位的出生地的今日天气」这个任务中,问题被拆解成了: 尝试搜集获奖者信息 尝试找到最年轻者的出生地 查询出生地的当日天气 总结上述信息
深度推理,是重要的之前拆结果 o1: 150 行代码,复刻「草莓」,青春版支持联网 独家信息:关于 o1 的 20 个真相
o1 很强,但也有一些不够好的地方,比如:除了部分代码场景,并不实用 比如:不能联网,不能运行代码,等等。这些是问题,也是实打实的用户痛点。
智谱的这个更新,更类似「perplexity pro」,但更强大&实用。
ingFang SC";font-size: medium;text-align: center;display: inline-block;border-radius: 10px;border-width: 0.5px;border-style: solid;border-color: gray;"/>
0. 免费,不限量:这个很重要
1. 单次可以支持超过 100个 网页的并发搜索:针对用户的问题,可同时检索超过100个网页,并基于此生成答案 
2. 多级推理的思维链:能够解决日常生活中绝大多数的困难问题。
3. All Tools:在联网搜索和多级推理的过程中,调用python等工具,多方位解决问题(非常重要)。在处理项目的过程中,同时完成图像生成、代码执行、数据分析等多种复杂任务,自动调用代码解释器进行复杂的数学计算或文件处理、生成图表和PPT等格式的文件。 比如,在下面的场景中,综合了联网、列表格和代码处理: 
|