返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

字节跳动开源了一套比Manus更强大的Agent:TARS

[复制链接]
链载Ai 显示全部楼层 发表于 6 小时前 |阅读模式 打印 上一主题 下一主题

Agent TARS是一款开源的多模态AI代理,它能够通过视觉解析网页内容,并与命令行和文件系统无缝集成。还适合于深度研究、操作系统功能,复杂工作流。

189f7bf9-cb6e-4f5f-bcd5-7b3161ee2b99.png

主要特点上比Manus更加的强大:

  • 高级浏览器操作:通过代理框架执行深度研究和操作功能等复杂任务,实现全面的规划和执行。
  • 全面工具支持:集成搜索、文件编辑、命令行和模型上下文协议(MCP)工具,处理复杂工作流。
  • 增强桌面应用:全新UI设计,包括浏览器显示、多模态元素、会话管理、模型配置、对话流可视化以及浏览器/搜索状态跟踪。
  • 工作流编排:无缝连接GUI代理工具——搜索、浏览、探索链接,并将信息合成为最终输出。
  • 开发者友好框架:简化与UI-TARS的集成和GUI代理项目的自定义工作流创建。

Agent TARS使用

必要配置

在开始之前,需要进行一些必要的配置。

点击左下角按钮打开配置页面:

ded04a1c-e9cd-4599-99e2-03a065a44d6c.png


然后就可以设置模型配置和搜索配置了。

对于模型配置,你可以设置模型提供商和API密钥:

1ddcc5e1-e3f9-4ece-a83e-5d3c9a705ed9.png

对于Azure OpenAI,可以设置更多参数,包括apiVersion、deploymentName和endpoint。

对于搜索配置,可以设置搜索提供商和API密钥:

2d58d5d2-c22e-4803-ada8-fe28f22633e3.png

在输入框中直接输入任务。TARS还支持Human In the Loop,意味可以通过输入框在工作过程中与代理交互。

如果想改变当前代理工作的方向,你可以在顶部位置的特殊输入框中插入新的想法,然后按回车键发送。

a512305b-6b8a-4816-9337-605dd35169ad.png

同时可以通过顶部菜单上的分享按钮与他人分享对话。

3f06a699-c859-4a6d-8255-da6b857e47f3.png

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ