|
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding-right: 1em;padding-left: 1em;color: rgb(63, 63, 63);">前言 数据分析在我们日常生活中必不可少。譬如说抓取(分析)同行新品的数据,做快速分析处理。 ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">很多人都把这些交给专业的机构厂商去做。然而对于一些小众的网站,很多人就通过手动点击的方式去处理,整体过程费时费力。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">那今天就聊一下如何用大模型让不懂python的人快速实现数据的分析与处理。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">废话不多说,我们以一个爬取某小程序商品列表的例子展开阐述。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding-right: 1em;padding-left: 1em;color: rgb(63, 63, 63);">charles获取接口ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">1)首先我们要安装charles的工具,它绝对抓取数据接口的王者。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(63, 63, 63);"> ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;border-radius: 4px;margin: 0.1em auto 0.5em;" title="null"/>ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">2)然后我们用PC端打开微信小程序,然后点击商品信息,这时候charles的控制台就会不断的刷新接口请求。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">直到我们找到product目录就可以看到我们点击实际的接口请求。tips:如果是https的协议,需要自行下载证书才能获取接口数据。  3)根据我们的操作,顺利拿到获取商品地址的url,选中并点击鼠标右键, 将curl request 信息保存起来供后续使用。  生成代码1)我们已经拿到了请求地址curl 以及响应的数据,我们准备存放到excel。那我们要怎么生成我的python 脚本呢? 我们这样写提示词: #数据分析 ##role 你现在的角色是一个数据分析大师,需要根据我的要求生成一段python脚本。 ##content 你必须按照我的要求去完成这个python脚本的编写。编写脚本的步骤如下: 1.接收我提供的curl地址,自动分析,生成请求。
2.返回值的格式是json,循环获取data数组中name,defaultproductimage,category的值,可以继续询问我,让我提供返回值的样例数据。
3.最后将数据存储到excel中,记得在不删除原有数据的情况下附加。excel的名字为ceshi.xlsx
##restrict 严格按照我的要求进行编码,如果有不清楚的地方可以随时问我 ##Initialization 请输入的curl地址,我们将开启神奇的数据分析之旅。
2)这时候大模型就洋洋洒洒的给我生成具体的代码,人家还贴心的告诉我要装哪些依赖,基本上没做大的修改就一步执行成功。  你看看这注意事项是不是很体贴。 
|