返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

5.5k Stars! Nanobrowser: 基于多智能体架构的开源浏览器自动化工具(支持多LLM集成)

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题
图片

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">有没有想过,怎么能让AI自动操作浏览器,执行各种任务,这不,有一款开源工具就很适合。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Nanobrowser是一款开源的人工智能网络自动化工具,以Chrome4扩展程序的形式在浏览器中运行。它借助先进的多智能体人工智能系统,使用户能够通过自然语言指令实现复杂网络任务的自动化。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">它可以作为OpenAI Operator的免费替代方案,具有灵活选择大语言模型(LLM)提供商以及完全本地掌控等额外优势。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这个扩展程序完全在浏览器内运行,确保您的数据和凭证私密。它能连接你所选的LLM提供商。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">github地址:https://github.com/nanobrowser/nanobrowser

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">核心功能

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Nanobrowser的功能主要围绕自动化基于网络的任务,这些任务通常需要手动导航和交互。该系统能够:

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">该系统对于重复性网络任务、研究活动以及数据收集工作流程尤其有价值,因为这些任务若手动执行通常耗时费力。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">系统架构概述

Nanobrowser采用多智能体架构,由专门的人工智能智能体协作完成网络任务。此图展示了其宏观架构:

该架构包含三个主要组件:

  1. 1. 用户界面:用户输入任务并查看结果的侧边栏
  2. 2. 多智能体系统:核心智能部分,由三个专门的智能体组成
  3. 3. 浏览器集成:使系统能够与网页交互的组件。

Nanobrowser的工作原理

Nanobrowser通过多智能体协作方式运行:

  1. 1. 任务输入:用户在侧边栏输入自然语言指令
  2. 2. 任务规划:规划智能体分析请求并制定详细计划
  3. 3. 网页执行:导航智能体通过控制浏览器执行计划
  4. 4. 结果验证:验证智能体验证任务是否正确完成
  5. 5. 用户反馈:向用户展示结果,用户可提出后续问题

此序列图展示了组件之间典型的交互流程:

扩展组件

Chrome扩展程序架构由多个协同工作的关键组件构成:

LLM提供商集成

Nanobrowser支持配置如下模型:

  • • OpenAI(GPT模型)
  • • Anthropic(Claude模型)
  • • Google(Gemini模型)
  • • DeepSeek模型
  • • Ollama(本地模型)
  • • 自定义OpenAI兼容端点

用户可根据特定需求为不同智能体分配不同模型。例如,规划智能体可能使用专为推理优化的更强大模型,而导航智能体则可使用更快且更具成本效益的模型。

这种灵活性使用户能够根据自身特定需求、偏好和预算限制优化使用体验。

入门指南

  1. 1. 从Chrome网上应用店安装扩展程序,或从GitHub发布页面手动安装。

  2. 2. 打开扩展程序并导航至设置页面

3. 通过添加API密钥配置LLM提供商,比如我是添加的硅基流动的API,要选最后一个OpenAl-compatible API Provider,然后配置API key、base url等。

  1. 4. 选择每个智能体使用的模型。

  1. 5. 返回主界面并开始输入任务。简单测试一下,“打开百度网页”,成功!

开发方式

Nanobrowser以单体仓库形式构建,采用模块化架构,具有可扩展性和易维护性。代码库分为几个关键目录:

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ