❝本文预计阅读时间:2分钟 UI-TARS介绍UI-TARS是bytedance(字节跳动)开源的,基于视觉语言模的 GUI 代理应用程序,允许使用自然语言控制计算机。 ❝详情:https://github.com/bytedance/UI-TARS-desktop UI-TARS安装访问下载地址:https://github.com/bytedance/UI-TARS-desktop/releases/tag/v0.1.2选择对应的安装程序。安装都是一直下一步,此处省略。 安装完毕后,点击图标打开UI-TARS: API准备使用UI-TARS需要火山引擎支持,访问https://www.volcengine.com/product/ark: 使用手机号登录: 登录到火山引擎界面: 点击“API Key管理”--->“创建API key”: 自定义一个名称,点击“创建”: 创建完毕后,点击小眼睛,可以查看key: 点击“复制”按钮,将key保留备用: UI-TARS配置❝参考:https://github.com/bytedance/UI-TARS-desktop/blob/main/docs/quick-start.md#doubao-15-ui-tars-on-volcengine 点击“Settings”,除了API Key之外,其他内容参照如下: 因为使用了指定的豆包大模型,需要在火上引擎中开通服务。 在火山引擎中,点击“开通管理”,找到指定的大模型,点击“开通服务”: 开通时会提示地区,默认即可: UI-TARS使用配置完毕后,可以通过对话框发送任务,比如: 此时,UI-TARS会调用浏览器查找内容,返回结果: ❝这个过程它会操作浏览器,将获取到结果返回。 更多妙用,大家可自行摸索。 |