链载Ai

标题: star 34.6k!通过DeepSeek实现AI自动化操作浏览器! [打印本页]

作者: 链载Ai    时间: 1 小时前
标题: star 34.6k!通过DeepSeek实现AI自动化操作浏览器!

如果能够通过大模型自动操作浏览器,无论是网页抓取、自动化测试还是数据收集都能大大提高效率。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">因为你无须编写和维护复杂的xpath、正则、css选择器脚本。今天,喵将介绍一个非常有趣的工具——browser-use[1],并结合ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">DeepSeek模型,展示通过 AI Agent自动化操作浏览器。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;padding: 0.3em 1em;color: rgb(255, 255, 255);background: rgb(0, 152, 116);border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 6px;">开始使用

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-left: 12px;color: rgb(63, 63, 63);">1. 安装依赖

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">首先,你需要确保有一个基础的Python 环境,Python版本要大于3.11。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14px;margin: 10px 8px;color: rgb(201, 209, 217);background: rgb(13, 17, 23);text-align: left;line-height: 1.5;overflow-x: auto;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.05) 0px 0px 10px inset;padding: 0px !important;">pip install browser-use
playwright install

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-left: 12px;color: rgb(63, 63, 63);">2. 编写测试脚本

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 16px;text-indent: 2em;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">browser-use官方推荐使用 GPT-4 模型,但为了降低成本,我们可以使用ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">DeepSeek。官方的有点卡,我这里使用的是硅基流动的deepseek-ai/DeepSeek-V2.5

接下来,我们可以编写一个简单的 Python 脚本来测试browser-use的功能。以下是一个示例脚本,用于获取财联社电报的前十条新闻资讯:

fromlangchain_openaiimportChatOpenAI
frombrowser_useimportAgent
importasyncio

if__name__ =='__main__':
llm = ChatOpenAI(model="deepseek-ai/DeepSeek-V2.5", api_key="api-key", base_url="https://api.siliconflow.cn")
asyncdefmain():
agent = Agent(
task="打开财联社https://www.cls.cn/telegraph,获取前十条资讯",
llm=llm,
use_vision=False,
)
result =awaitagent.run()
print(result)

asyncio.run(main())

3. 运行脚本并查看结果

运行上述脚本后,browser-use会自动打开浏览器,访问指定的财联社地址,并获取前十条资讯。结果将打印在控制台中。

下面是browser-use获取到的数据,并且自动转为了json格式,对于抓取数据可谓是相当友好了。

注意: 本文中的示例代码和配置仅供参考,实际使用时请根据你的需求进行调整






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5