|
Agent TARS是一款开源的多模态AI代理,它能够通过视觉解析网页内容,并与命令行和文件系统无缝集成。还适合于深度研究、操作系统功能,复杂工作流。  主要特点上比Manus更加的强大: - 高级浏览器操作:通过代理框架执行深度研究和操作功能等复杂任务,实现全面的规划和执行。
- 全面工具支持:集成搜索、文件编辑、命令行和模型上下文协议(MCP)工具,处理复杂工作流。
- 增强桌面应用:全新UI设计,包括浏览器显示、多模态元素、会话管理、模型配置、对话流可视化以及浏览器/搜索状态跟踪。
- 工作流编排:无缝连接GUI代理工具——搜索、浏览、探索链接,并将信息合成为最终输出。
- 开发者友好框架:简化与UI-TARS的集成和GUI代理项目的自定义工作流创建。
Agent TARS使用必要配置在开始之前,需要进行一些必要的配置。 点击左下角按钮打开配置页面:
然后就可以设置模型配置和搜索配置了。 对于模型配置,你可以设置模型提供商和API密钥:  对于Azure OpenAI,可以设置更多参数,包括apiVersion、deploymentName和endpoint。 对于搜索配置,可以设置搜索提供商和API密钥: 在输入框中直接输入任务。TARS还支持Human In the Loop,意味可以通过输入框在工作过程中与代理交互。 如果想改变当前代理工作的方向,你可以在顶部位置的特殊输入框中插入新的想法,然后按回车键发送。  同时可以通过顶部菜单上的分享按钮与他人分享对话。  |