返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

Copilot Studio :新增“电脑操作 RPA”神技,让 AI 替你搞定繁琐的电脑任务

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 17:59 |阅读模式 打印 上一主题 下一主题


如果你觉得 AI 离你的日常工作还很远,或者觉得配置 AI 工具太复杂,那么微软 Copilot Studio 带来的这项新功能,可能会让你眼前一亮。


AI 发展的快车道 与 Copilot Studio 的持续进化



人工智能技术正以前所未有的速度发展,而微软一直处在这个浪潮的前沿。他们的 Copilot Studio 平台,就是一个致力于将顶尖 AI 技术整合起来,帮助企业解决实际业务挑战的强大工具。

就在上个月,这个平台才刚刚引入了让 AI 助手拥有更强“深度推理”能力、支持新的模型交互协议(MCP),并正式推出了“智能体流程”(Agent flows)功能。

感兴趣的可以看我的往期视频。

而今天,微软的 Business & Industry Copilot CVP -Charles Lamanna 又宣布了一个激动人心的消息:Copilot Studio 即将推出一项名为“电脑操作”(Computer Use)的新功能,目前正处在早期研究预览阶段。

这项功能厉害在哪里?简单来说,它让你创建的 AI 智能体能够直接像人一样,去操作你的电脑!


“电脑操作”:AI 直接上手,与任何图形界面互动



没错,你没听错。有了“电脑操作”功能,AI 智能体不再仅仅是信息的搬运工或对话者,它们可以直接“看到”并“操作”网站和桌面应用程序的图形用户界面(GUI)——也就是我们平时用鼠标键盘交互的那个屏幕界面。

想象一下,你的 AI 助手可以做到:

点击按钮

选择菜单项

在输入框里打字

这意味着什么?即使某个软件或系统没有提供专门的应用程序接口(API)供程序调用,只要一个人能够通过界面手动操作它,那么现在,Copilot Studio 的 AI 智能体也能做到! 这大大拓宽了 AI 自动化的边界。


不仅仅是模拟点击,更是智能与效率的提升



这项新功能带来的好处是显而易见的:

超强的适应性


最让人头疼的是,软件界面经常会更新,按钮位置变了、菜单改名了,传统的自动化脚本可能就“罢工”了。

但“电脑操作”功能具备实时适应能力。它内置了智能推理机制,能够实时理解屏幕上的变化并自我调整,确保自动化任务不被打断,工作流程持续顺畅。

安全合规有保障


这项功能建立在 Copilot Studio 成熟的安全措施和治理框架之上。企业数据会保留在微软云的边界内,并且不会被用来训练底层的 AI 大模型,有助于确保数据安全,并满足企业和行业的合规标准。

云端运行,降本增效


“电脑操作”功能运行在微软托管的基础设施上。这意味着企业用户无需自己购买、部署和维护服务器,可以直接使用。这不仅加快了部署速度,还减少了维护工作量和基础设施成本。它支持在多种桌面和浏览器应用(包括 Edge、Chrome、Firefox)上执行自动化任务。

解锁全新的自动化场景,告别繁琐重复


这项技术能为我们带来哪些实际价值呢?让我们来看几个典型的应用场景:



自动化数据录入


想象一下,企业需要将来自不同来源(比如各种表格、网页、旧系统)的大量数据录入到一个集中的新系统里。这项工作通常耗时耗力且容易出错。“电脑操作”功能可以自动模拟人工操作,准确无误地完成数据迁移和录入,解放人力。

市场调研信息收集


市场部门需要定期从各种在线渠道(新闻网站、社交媒体、行业报告网站等)收集市场数据进行分析。“电脑操作”可以自动化这个过程,模拟人浏览网页、复制粘贴信息的操作,高效获取所需数据,而无需人工干预。

发票处理自动化


财务部门每天都要处理大量发票。利用“电脑操作”,AI 智能体可以自动打开扫描的发票文件(或电子发票网页),识别关键信息(如发票号、金额、日期、供应商),然后自动将这些数据输入到会计系统中,大大简化发票处理流程,减少手动错误。

重新定义 RPA(机器人流程自动化)


如果你对 RPA(机器人流程自动化)有所了解,你可能会觉得这听起来有点像。确实,“电脑操作”功能正在革新传统的 RPA。

传统 RPA 的一个主要痛点在于其脆弱性——它往往依赖于固定的界面元素(如按钮的 ID 或位置)。一旦软件界面稍作修改,RPA 脚本就可能失效,需要专业人员进行维护。此外,传统 RPA 对于复杂的、动态变化的界面处理能力有限。

而 Copilot Studio 的“电脑操作”通过引入AI 的智能,克服了这些局限:

更智能,不怕变


当界面元素变化时,AI 智能体凭借其“视觉”和“理解”能力,依然能找到正确的操作对象,自动化流程不易中断。

更易用,门槛低


创建自动化任务变得更简单。你甚至可以用自然语言描述你希望 AI 完成的操作(比如“打开这个网站,找到最新的报告,下载下来”),然后通过实时的并排视频(一边是 AI 的推理过程,一边是实际的界面操作模拟)来测试和优化你的指令,无需编写复杂的代码。这使得非专业 RPA 开发者也能轻松创建自动化流程。

更强大,应付复杂场景


AI 智能体能够实时“看到”屏幕内容,并根据当前情况做出智能决策,即使在复杂或不断变化的环境中也能有效工作。

过程透明,可追溯


开发和管理人员可以随时查看“电脑操作”的活动历史记录,包括操作时的屏幕截图和 AI 的决策推理步骤,方便监控和调试。



Copilot Studio的未来:赋能创新与效率



总而言之,微软 Copilot Studio 正在朝着一个端到端的智能体平台发展,旨在帮助组织实现其 AI 目标和运营效率提升。通过“电脑操作”这样的创新功能,微软希望赋予用户更强大的能力,去简化流程、提高生产力,并最终推动业务创新。

想尝鲜吗?

如果你对这项强大的“电脑操作”新功能非常感兴趣,希望成为第一批体验者,可以填写微软提供的这个表单,表达你的参与意愿。

https://aka.ms/mcs-cua-preview

此外,微软也预告了,在 2025 年 5 月举行的 Microsoft Build 全球开发者大会上,他们将分享更多关于这项新功能的细节。感兴趣的朋友可以关注一下。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ