返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

UI-TARS Desktop:智能桌面控制更高效

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 21:04 |阅读模式 打印 上一主题 下一主题

本文预计阅读时间:2分钟

UI-TARS介绍

UI-TARS是bytedance(字节跳动)开源的,基于视觉语言模的 GUI 代理应用程序,允许使用自然语言控制计算机。

详情:https://github.com/bytedance/UI-TARS-desktop

UI-TARS安装

访问下载地址:https://github.com/bytedance/UI-TARS-desktop/releases/tag/v0.1.2选择对应的安装程序。安装都是一直下一步,此处省略。

安装完毕后,点击图标打开UI-TARS:

API准备

使用UI-TARS需要火山引擎支持,访问https://www.volcengine.com/product/ark:使用手机号登录:登录到火山引擎界面:点击“API Key管理”--->“创建API key”:自定义一个名称,点击“创建”:创建完毕后,点击小眼睛,可以查看key:点击“复制”按钮,将key保留备用:

UI-TARS配置

参考:https://github.com/bytedance/UI-TARS-desktop/blob/main/docs/quick-start.md#doubao-15-ui-tars-on-volcengine

点击“Settings”,除了API Key之外,其他内容参照如下:因为使用了指定的豆包大模型,需要在火上引擎中开通服务。

在火山引擎中,点击“开通管理”,找到指定的大模型,点击“开通服务”:开通时会提示地区,默认即可:

UI-TARS使用

配置完毕后,可以通过对话框发送任务,比如:此时,UI-TARS会调用浏览器查找内容,返回结果:

这个过程它会操作浏览器,将获取到结果返回。

更多妙用,大家可自行摸索。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ