 #大模型#AI#Prompt#编程发现微软开源了一个专门用来写Prompt的标记语言POML 下午试玩了一下,配合Claude Code把自己很久之前一个小项目中的 prompt 用 POML 重构了下。大概体验了一下这个语言的特点。 一、概述简而言之,POML 就是一个标准的「标记语言」的定位,类似HTML是网页格式的标准化一样,POML尝试把 Prompt 的书写给「标准化」了,另外,也把「内容」和「渲染」分离开来。 相比传统的字符串模板,提供了: - 结构化组织: 语义化的组件如
<role>、<task>、<stepwise-instructions> - 多格式输出: 可渲染为 Markdown、JSON、HTML 等多种格式
二、示例我重构的一个例子(这个prompt因为年代太久,其实现在已经用处不大了,参考它其中的标签元素用法即可): <poml> <role>你是一名资深的内容策略专家和主题分析师,具有10年以上的学术研究和内容策划经验。你善于从复杂的多源信息中提炼出核心主题,并能准确把握不同领域的专业术语和概念关联。</role>
<task>基于提供的资源内容,运用系统性分析方法推断出最佳的文章主题</task>
<inputcaption="待分析资源内容">{{resources_content}}</input>
<examplescaptionStyle="header"caption="学习示例"> <examplecaptionStyle="bold"caption="示例一:计算机视觉主题"> <inputcaption="资源内容"syntax="text">论文1: 深度学习在图像识别中的应用研究 论文2: 卷积神经网络优化算法分析 论文3: 计算机视觉领域的最新进展</input> <outputcaption="完整分析过程"> <section> <h>第一步:关键概念提取</h> <listlistStyle="dash"> <item>深度学习、图像识别、卷积神经网络、优化算法、计算机视觉</item> </list> </section> <section> <h>第二步:主题域识别</h> <listlistStyle="dash"> <item>核心领域:人工智能/机器学习</item> <item>具体方向:计算机视觉</item> <item>技术焦点:深度学习算法</item> </list> </section> <section> <h>第三步:重要性评估</h> <listlistStyle="dash"> <item>图像识别是计算机视觉的核心应用</item> <item>深度学习是当前主流技术</item> <item>优化是实用性关键</item> </list> </section> <section> <h>第四步:主题综合</h> <p>基于频次分析和重要性权衡,核心主题围绕"深度学习在计算机视觉中的应用与优化"</p> </section> <section> <h>最终主题</h> <p><b>深度学习驱动的计算机视觉</b></p> </section> </output> </example> <examplecaptionStyle="bold"caption="示例二:区块链金融主题"> <inputcaption="资源内容"syntax="text">报告1: 区块链技术在金融行业的应用现状 报告2: 数字货币监管政策分析 报告3: 分布式账本技术的安全性研究</input> <outputcaption="完整分析过程"> <section> <h>第一步:关键概念提取</h> <listlistStyle="dash"> <item>区块链、金融、数字货币、监管政策、分布式账本、安全性</item> </list> </section> <section> <h>第二步:主题域识别</h> <listlistStyle="dash"> <item>核心领域:金融科技</item> <item>技术基础:区块链技术</item> <item>关注点:应用与监管</item> </list> </section> <section> <h>第三步:重要性评估</h> <listlistStyle="dash"> <item>金融是区块链最重要的应用场景</item> <item>监管是行业发展的关键因素</item> <item>安全性是技术可信度基础</item> </list> </section> <section> <h>第四步:主题综合</h> <p>主题应该涵盖技术应用、政策环境和安全保障三个维度</p> </section> <section> <h>最终主题</h> <p><b>区块链金融应用与监管</b></p> </section> </output> </example> </examples>
<stepwise-instructionscaption="分析步骤指南"> <listlistStyle="decimal"> <item><b>深度阅读</b>:逐一仔细阅读所有资源内容,理解每个资源的核心观点和专业词汇</item> <item><b>概念提取</b>:识别并列出所有关键概念、技术术语、方法论和研究对象</item> <item><b>主题域映射</b>:确定资源所属的学科领域、技术方向或应用场景</item> <item><b>关联分析</b>:分析不同资源间的概念重叠、逻辑关系和层次结构</item> <item><b>重要性权衡</b>:基于出现频次、技术重要性和实际影响力评估各概念的权重</item> <item><b>主题综合</b>:整合分析结果,提炼出能够统领所有资源的核心主题</item> <item><b>质量检验</b>:验证主题的准确性、完整性和表达效果</item> </list> </stepwise-instructions>
<cpcaption="思维链分析结构"> <p>请严格按照以下结构进行逐步分析,展示你的完整推理过程:</p> <listlistStyle="decimal"> <item><b>第一步:关键概念提取</b>列出从各个资源中识别出的关键术语、概念和主题词</item> <item><b>第二步:主题域识别</b>确定资源涉及的核心学科领域、技术方向或应用场景</item> <item><b>第三步:重要性评估</b>分析各概念的重要性权重和相互关系</item> <item><b>第四步:主题综合</b>说明如何整合分析结果得出最终主题</item> </list> </cp>
<cpcaption="质量标准"> <p>主题必须满足以下要求:</p> <listlistStyle="star"> <item><b>准确性</b>:准确反映所有资源的核心内容</item> <item><b>完整性</b>:涵盖资源的主要维度,不遗漏重要方面</item> <item><b>简洁性</b>:控制在8-15个汉字,便于理解和记忆</item> <item><b>专业性</b>:使用准确的专业术语,体现学术严谨性</item> <item><b>吸引力</b>:具有一定的概括性和表达力</item> </list> </cp>
<cpcaption="常见错误预防"> <p>避免以下问题:</p> <listlistStyle="dash"> <item>主题过于宽泛,缺乏针对性(如"人工智能研究")</item> <item>主题过于具体,无法覆盖所有资源</item> <item>使用过时或不准确的术语</item> <item>忽略资源间的重要关联</item> <item>主题表达冗长或模糊</item> </list> </cp>
<output-formatcaption="输出格式要求"> <p>请严格按照以下格式输出:</p> <section> <h>思维链分析</h> <p>[按照上述四个步骤展示完整推理过程]</p> </section> <section> <h>最终结果</h> <p>主题:[8-15个汉字的主题名称]</p> </section> <section> <h>主题说明</h> <p>[用1-2句话简要说明主题的核心内涵和覆盖范围]</p> </section> </output-format> </poml>
可以用VSCode中的POML插件预览渲染后的结果:
也可以看渲染成Markdown的样子:
三、程序集成在程序中使用,配合SDK(我的项目是Python语言): importasyncio frompathlibimportPath fromtypingimportAny
importpoml
classPOMLLoader: """ OML 提示词加载器"""
def__init__(self, prompts_dir: str | Path = None): """初始化加载器
Args: prompts_dir: POML 提示词文件目录,默认为当前模块的 prompts 目录 """ ifprompts_dirisNone: prompts_dir = Path(__file__).parent /'prompts' self.prompts_dir = Path(prompts_dir)
asyncdefload_prompt(self, name: str, variables: dict[str, Any] = None)-> str: """加载并渲染 POML 提示词
Args: name: 提示词名称(不含扩展名) variables: 传入的变量字典
Returns: 渲染后的提示词文本
Raises: FileNotFoundError: 当提示词文件不存在时 """ poml_file = self.prompts_dir /f'{name}.poml'
ifnotpoml_file.exists(): raiseFileNotFoundError(f' OML 文件不存在:{poml_file}')
# 使用 POML SDK 的 context 参数进行变量注入 messages = poml.poml(poml_file, context=variables, parse_output=True)
# 从消息列表中提取内容 ifisinstance(messages, list)andmessages: # 合并所有消息的content字段 contents = [] formsginmessages: ifisinstance(msg, dict)and'content'inmsg: contents.append(msg['content']) return'\n\n'.join(contents)
returnstr(messages)
defload_prompt_sync(self, name: str, variables: dict[str, Any] = None)-> str: """同步版本的加载提示词方法""" returnasyncio.run(self.load_prompt(name, variables))
# 默认加载器实例 default_loader = POMLLoader()
asyncdefload_theme_infer_prompt(resources_content: str)-> str: """加载主题推断提示词""" returnawaitdefault_loader.load_prompt('theme_infer', {'resources_content': resources_content})
在写这个加载器的时候,发现这个库目前还非常不成熟,文档中poml函数有一个format参数,但是最近的稳定版0.0.7并不支持,这一点让 Claude Code 写的很纠结,最后只好不那么优雅地自己额外提取并拼接了一下渲染后的结果。
总结- 有点用处,如果你的prompt比较多,可以更程序化地管理
- 内容与渲染分离,理论上也更有拓展性,不过我目前的场景基本只用markdown,所以这部分好处还显现不太出来,只有心理作用会感觉更「干净」一点。
|