好久没写工具方面的汇报了,正好欠了两个内容,一是关于Claude的Cowork,另一个是如何快速将pdf导出成一页一张的图片。巧合的是,确实可以把两者结合起来,实现部分非常简单,但如果将这种方式跟Mac系统已经有的Automator比较的化,又确实是一种新的解决方法,居然还有些启发。
尽可能保持文字简单。
Anthropic在1月12日推出了Cowork,展示的重要案例之一是PC的文件夹整理:将乱七八糟的桌面整理干净,如下两图所示。


Cowork是Claude应用客户端的一个功能,所以,先需要下载并安装客户端。Anthropic在发布时声称该功能目前只在macos的客户端上,不知道一周过后windows客户端是否也支持了。

下载安装后,在左边栏选择cowork的标签页即可。

在对话框输入栏选择执行目录。

既然演示里是整理目录,那我换一个简单任务,正好最近精选并批量输出了今年以来拍摄的一部分照片,那就做个网页浏览所有照片吧。
如前面一张图所示,Cowork快速的完成了页面,当然,这对Claude模型而言很简单,当然,对目前任何模型都一样。
不过,第一个版本还是有些问题,图片可以正常浏览,但是全部342张照片只显示了50张,如果看对应代码的话,因为“偷懒”只列出了50张。

通过两次对话解决了问题:第一次是要求显示所有图片,Cowork用了两种方案,一种是后台使用python起一个web服务,另一种是直接写一个包含所有图片文件的列表清单。

如果按照推荐的方式,会出现cors的错误,所以第二次对话就是在修这个bug上,当然,对于模型而言,依旧很简单:结果没问题了。

这当然是一个简单任务,不过Cowork承袭了Claude Code一贯的流畅感,这种流畅即来自于模型能力,也来自于对workflow的优化上,如今更是加入了skills的支持,完成度确实可以。
其实,这些能力,在Claude Code时代早就具备了,不过利用桌面应用程序,极大的提升了交互特性,比如这种直接对文件夹的操作,比如直接屏幕截图,当然后面如果跟Chrome插件结合,可以边浏览网页边储存边分析数据,那超级工作助手的定位会更舒服。模型能力都到了,就看怎么优化了。
第二个小任务,正好前段时间欠一个关于“pdf导出成若干张图片”的介绍,所以,在写怎么使用mac的automator功能前,也让Cowork做一次吧。
正好线上线下交流的资料里有pdf,也有图片,就尝试一下吧。如预期一样,用了python的pdf2image的library,结果,当然也没问题。


唯一的问题来自于,换一个目录,就得重新让Cowork做一遍,当然可以直接改一下它的代码,执行一遍,但,这样不就不太酷了吗?
所以,目前的最佳方案自然还是macos内置的automator功能。
首先,打开automator应用。

其次,选择Quick Action。

然后,分别从左边的library中,在PDFs类别下拉一个“Render PDF Pages as Images”到右边工作区,再从Files下拉一个“Copy Finder Items”到render的动作下面,设定一下目标路径,然后保存。


于是,右击任何pdf文件,就会在quick action下面多出一个选项,点击即可。所有图片文件就会在设定的目标目录下出现。

是不是比Cowork好很多?
当然,作为苹果数年前就推出的功能,Automator能够实现的操作太多了,我一度认为只要有个模型,调用Automator这些基本操作,siri2.0根本不难的。我想,苹果肯定也是这么想的,然后,就是,难产。算了,不提了。
上面的操作都很简单,但做一遍后,给了自己关于一个问题更清晰的答案:
我们需要什么样的AI或者Agent?
其实到现在,我觉得“Co****”大概就是边界所在,除非人要求,否则不代替人做决定,也许是一条非常重要的规则;
所以,或许在很长一段时间里,节奏还需要靠“人”来掌握,否则就是会带来灾难性的结果,不是指“取代人”,而是产生的结果本身会是灾难;
最后,是一个有些模糊答案但还没想太好的问题,目前,我可能真的更倾向于所谓AI助手,在PC上的场景比手机要好很多,或许原因来自于“多任务交互”,数据量和处理能力,以及,目标吧。
还没想太好。