返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

N个promptPilot的数据集,验证一个提示词,效果就是稳!

[复制链接]
链载Ai 显示全部楼层 发表于 前天 22:20 |阅读模式 打印 上一主题 下一主题


ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">有粉丝留言问我ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14.4px;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">promptPilot真有说的那么好吗?就像程序员常挂到嘴边的一句话,ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14.4px;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">Talk is cheap, show me your code今天就跟大家演示一下,ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14.4px;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">Talk is cheap, show me your prompt。先说一下要解决的痛点,通常在准备写一篇文章的时候需要从各大平台找一些相关文章的资料,然后通过工具或者脚本把文章内容爬取下来,爬取下来的内容什么格式的都有,有些工具会把平台的标头、侧边栏、尾部导航栏、甚至一些广告都抓取下来。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;display: block;max-width: 100%;margin: 0.1em auto 0.5em;border-radius: 8px;box-shadow: rgba(0, 0, 0, 0.1) 0px 4px 8px;" title="null"/>

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这就涉及到使用AI去做一些数据清洗,那么就需要写一个提示词来提取文章内容。但是你发现直接让AI生成的提示词是没办法满足你的需求,这个时候ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(85, 201, 234);font-weight: bold;">promptPilot就可以帮助到你。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">我使用的ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(85, 201, 234);font-weight: bold;">promptPilot的批量评测功能,目的是为了通过N多个测试用例集去验证优化后的提示词效果,通过调试——评测——评分——再调试——再评分,这样一个流程,最终保证提示词生成的模型回答符合你的预期。

准备工作

  1. 1. 注册一个promptPilot账号,新用户订阅享受0元购,购买链接https://www.volcengine.com/activity/ark?previewMode=on
  2. 2. 提前整理一个excel表格,把需要验证的数据写入到表格中,表格中的数据就是promptPilot对应的变量内容。我这里提前准备好了一个文章测试集数据,从一些不同的网站中(CSDN、博客园、medium)爬取下来的。
  1. 3. 准备一个用AI已经优化过的结构化提示词,我先贴在这里这样的提示词网上一大堆
prompt = f"""
你是一个专业的内容提取专家。请根据给定的标题,从提供的内容中提取出与标题最相关的部分。

## 核心任务
1. **深度分析标题**:识别标题中的核心主题、关键词、技术术语、产品名称等
2. **全面内容扫描**:逐段分析内容,识别与标题相关的所有信息
3. **智能关联判断**:不仅提取直接相关内容,还要包含间接相关、背景信息、对比分析等
4. **完整性保证**:确保提取的内容能够完整地支撑和解释标题主题

## 内容提取原则
### 宽泛性原则
- 采用宽泛的相关性判断标准,宁可多提取也不要遗漏重要信息
- 包含与标题主题相关的所有讨论、观点、经验分享
- 保留作者的个人见解、使用体验、对比评价
- 包含相关的技术细节、使用场景、代码块、问题解决方案

### 上下文完整性
- 提取完整的段落,不要截断句子或段落
- 保持论述的逻辑连贯性和完整性
- 包含必要的背景信息和铺垫内容
- 保留结论性和总结性的内容

### 多维度相关性
- **直接相关**:明确提到标题中的关键词或主题
- **功能相关**:讨论相关功能、特性、使用方法
- **对比相关**:与标题主题进行对比的其他产品或方案
- **经验相关**:使用经验、问题解决、心得体会
- **背景相关**:行业背景、发展历程、市场情况

## 图片链接处理规则
- **完整保留原则**:所有与相关内容共存的图片链接必须完整保留
- **位置保持原则**:图片链接必须保持在原文中的确切位置
- **格式兼容原则**:支持所有图片格式和引用方式:
* Markdown格式:![alt text](image_url)
* HTML格式:<img src="image_url" alt="alt text">
* 直接URL:https://example.com/image.jpg
* 相对路径:./images/pic.png
- **上下文关联原则**:图片与其说明文字、标题、段落内容必须作为整体保留

## 质量控制标准
### 内容丰富度
- 提取的内容应该占原文的60-80%(对于高度相关的文章)
- 包含足够的细节和具体信息
- 保留作者的观点表达和情感色彩

### 逻辑完整性
- 保持文章的论述逻辑
- 包含问题提出、分析过程、解决方案、结论总结
- 维持时间顺序和因果关系

### 信息价值
- 优先保留独特见解和个人经验
- 包含具体的数据、案例、操作步骤
- 保留对读者有参考价值的信息

## 输入信息
标题: {title}

原始内容:
{content}

## 输出要求
请以JSON格式返回结果,包含以下字段:
- title: 原始标题
- extracted_content: 提取的与标题相关的内容(必须丰富完整,包含所有相关段落和图片)

## 特别注意
- **宽泛提取策略**:当不确定某段内容是否相关时,倾向于包含而非排除
- **完整性优先**:保持段落完整性,不要截断重要信息
- **上下文保持**:图片链接必须与其说明文字保持在同一段落中
- **质量标准**:提取内容应占原文60-80%,确保信息充分且有价值
- **逻辑连贯**:保持文章的论述逻辑和时间顺序
- **格式保持**:维持原始的段落结构、列表格式、代码块等
"""

这个提示词是通过claude4.0生成的,从结构和专业性上来看已经很不错了,角色、工作流程、限制条件、输入信息、输出信息、输出格式、要求等等。接下来看看通过这个提示词提取出来的内容效果。

优化前的提取内容效果

出现了标签、平台头部信息、顶部导航栏、底部导航栏(售后、调研、业务咨询、参考资料)等等一些和文章内容不相关的元素

批量评测

promptPilot的批量评测功能真的可以帮你节省不少时间,你只需把准备好的批量数据集导入进来,剩下的交给平台就好,然后再等待评分结果

评分标准

内容提取出来的效果是否符合你的预期,需要定一个标准,比如:

  • • 提取的内容需要和标题高度相关
  • • 提取内容不能有遗漏
  • • 格式需要符合markdown文本
  • • 元素完整性表格、图片、代码块不能有遗漏

从评分效果来看提示词需要优化的空间在哪里

优化提示词

promptPilot提供了优化提示词前后的文本对比,方便用户快速查看两个文本之间的差异

优化后的提取内容效果

找了其中一篇比较长的测试内容,里面的内容比较丰富有表格、有代码块、有图片

看一下返回的markdown预览效果

基本上去除了所有不需要的元素最重要的是保留了原始内容和标题的一致性。

看到这里相信你已经清楚这个提示词优化后的价值所在,promptPilot的价值所在,它到底好不好相信你自己心中已有答案。

不要相信自己的感觉,最终通过数据来说话,如果你的样本数据足够多,我相信这个提示词会优化的更加精准,当所有评分80%的都给出5分的时候,这个提示词真的可以卖钱,因为它是通过N多个测试数据集验证后总结出来的,它值这个钱

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ