ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">有没有想过,怎么能让AI自动操作浏览器,执行各种任务,这不,有一款开源工具就很适合。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Nanobrowser是一款开源的人工智能网络自动化工具,以Chrome4扩展程序的形式在浏览器中运行。它借助先进的多智能体人工智能系统,使用户能够通过自然语言指令实现复杂网络任务的自动化。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">它可以作为OpenAI Operator的免费替代方案,具有灵活选择大语言模型(LLM)提供商以及完全本地掌控等额外优势。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);"> ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这个扩展程序完全在浏览器内运行,确保您的数据和凭证私密。它能连接你所选的LLM提供商。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">github地址:https://github.com/nanobrowser/nanobrowseringFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">核心功能ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Nanobrowser的功能主要围绕自动化基于网络的任务,这些任务通常需要手动导航和交互。该系统能够:ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">该系统对于重复性网络任务、研究活动以及数据收集工作流程尤其有价值,因为这些任务若手动执行通常耗时费力。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">系统架构概述Nanobrowser采用多智能体架构,由专门的人工智能智能体协作完成网络任务。此图展示了其宏观架构: 该架构包含三个主要组件: - 2. 多智能体系统:核心智能部分,由三个专门的智能体组成
Nanobrowser的工作原理Nanobrowser通过多智能体协作方式运行: - 5. 用户反馈:向用户展示结果,用户可提出后续问题
此序列图展示了组件之间典型的交互流程: 
扩展组件Chrome扩展程序架构由多个协同工作的关键组件构成: LLM提供商集成Nanobrowser支持配置如下模型: 用户可根据特定需求为不同智能体分配不同模型。例如,规划智能体可能使用专为推理优化的更强大模型,而导航智能体则可使用更快且更具成本效益的模型。 这种灵活性使用户能够根据自身特定需求、偏好和预算限制优化使用体验。 入门指南- 1. 从Chrome网上应用店安装扩展程序,或从GitHub发布页面手动安装。
3. 通过添加API密钥配置LLM提供商,比如我是添加的硅基流动的API,要选最后一个OpenAl-compatible API Provider,然后配置API key、base url等。
- 5. 返回主界面并开始输入任务。简单测试一下,“打开百度网页”,成功!
开发方式Nanobrowser以单体仓库形式构建,采用模块化架构,具有可扩展性和易维护性。代码库分为几个关键目录: |