|
Google 推出了 Gemini Deep Research,直指 AI 回答“浅尝辄止”的问题。与只做快速搜索、总结首条结果不同,这个 Agent 更像一名真正的研究员:
它会先制定研究计划,系统性阅读多源材料,识别信息缺口,并持续检索,直到形成相对完整的认知图景。最终,它会输出一份结构化研究报告,并为每一条关键结论提供可追溯的引用来源。
Gemini Deep Research 基于 Gemini 3 Pro 构建,面向的是需要“深度调研能力”的开发者,而非只做即时问答的聊天场景。
Interactions API
与此同时,Google 还发布了统一的 Interactions API,用于同时调用模型与 Agent,支持服务端状态管理、后台执行以及 MCP(Model Context Protocol)。首个落地的 Agent 正是 Gemini Deep Research。
在评测层面,Google 开源了 DeepSearchQA,用于评估深度网页搜索类 Agent。该基准包含 900 个跨 17 个领域的多步研究任务,强调“因果链”和信息完整性,用来测试 AI 是否真的具备深入研究与系统整合能力,而不仅是查单点事实。官方数据显示,Deep Research 在 BrowseComp 上达到 SOTA,并在 HLE 上表现强劲。
经验层面也再次印证:Agent 的“编排能力”至关重要。一套极简的开源框架 Stirrup,在 GDPval-AA 指标上甚至超越了多个实验室的原生聊天环境。这表明,任务协调工具、状态管理方式以及可用计算预算,都会对最终效果产生实质性影响。
使用 Gemini Deep Research 构建应用
通过 Gemini Deep Research Agent,开发者可以构建下一代自动化研究工具:
- 统一信息综合:结合文件(PDF、CSV、Docs)与公共 Web 数据,支持 File Upload 与 File Search Tool
- 强上下文处理:可直接在 Prompt 中放入大规模背景材料
- 可控报告结构:通过 Prompt 精确定义章节结构、标题、小标题与数据表
- 结构化输出:支持 JSON Schema,便于下游系统解析
Gemini Deep Research 的真实应用场景
在早期用户反馈与测试中,Gemini Deep Research 已在多个对高精度与强上下文依赖的领域展现出立竿见影的价值,包括:
金融尽调
金融机构正使用 Gemini Deep Research 自动化尽调的前期阶段。 通过聚合全网及私有数据中的市场信号、竞品分析与合规风险,该 Agent 成为投资团队早期研究中的超级放大器。
科学研究与生物医药
在科研领域,Deep Research 正帮助解决高度复杂的安全与知识整合问题。 Axiom Bio(致力于 AI 药物毒性预测)发现,Gemini Deep Research 在生物医学文献中提供了前所未有的研究深度与粒度,加速了药物发现流程。
应用
https://ai.google.dev/gemini-api/docs/deep-research
我用 Antigravity 跑的,安装好之后直接说:
Starting research on: how to improve vo2max
跑了蛮久的:
下面是给我的结果:
|