链载Ai

标题: 让 LLM 来评判 | 设计你自己的评估 prompt [打印本页]

作者: 链载Ai    时间: 4 小时前
标题: 让 LLM 来评判 | 设计你自己的评估 prompt

ingFang SC", ui-sans-serif, system-ui, -apple-system, Roboto, "Helvetica Neue", Arial, sans-serif; white-space: normal; margin-top: 30px; margin-bottom: 15px; align-items: unset; background-attachment: scroll; background-clip: border-box; background-image: none; background-origin: padding-box; background-position: 0% 0%; background-repeat: no-repeat; background-size: auto; border-style: none; border-width: 1px; border-color: rgb(0, 0, 0); border-radius: 0px; box-shadow: none; flex-direction: unset; float: unset; height: auto; justify-content: unset; line-height: 1.5em; overflow: unset; text-shadow: none; transform: none; width: auto; -webkit-box-reflect: unset;">通用 prompt 设计建议

ingFang SC", ui-sans-serif, system-ui, -apple-system, Roboto, "Helvetica Neue", Arial, sans-serif; letter-spacing: 0em; text-indent: 0em; white-space: normal; color: rgb(63, 63, 63); line-height: 1.8em; padding-top: 5px; padding-bottom: 5px;">我总结的互联网上通用 prompt 的通用设计原则如下:

ingFang SC", ui-sans-serif, system-ui, -apple-system, Roboto, "Helvetica Neue", Arial, sans-serif; letter-spacing: 0em; text-indent: 0em; white-space: normal; color: rgb(63, 63, 63); line-height: 1.8em; padding-top: 5px; padding-bottom: 5px;">Prompt 书写灵感可以参考或的 prompt 模板。

ingFang SC", ui-sans-serif, system-ui, -apple-system, Roboto, "Helvetica Neue", Arial, sans-serif; letter-spacing: 0em; text-indent: 0em; white-space: normal; color: rgb(63, 63, 63); line-height: 1.8em; padding-top: 5px; padding-bottom: 5px;">其他要点:

ingFang SC", ui-sans-serif, system-ui, -apple-system, Roboto, "Helvetica Neue", Arial, sans-serif; white-space: normal; margin-top: 30px; margin-bottom: 15px; align-items: unset; background-attachment: scroll; background-clip: border-box; background-image: none; background-origin: padding-box; background-position: 0% 0%; background-repeat: no-repeat; background-size: auto; border-style: none; border-width: 1px; border-color: rgb(0, 0, 0); border-radius: 0px; box-shadow: none; flex-direction: unset; float: unset; height: auto; justify-content: unset; line-height: 1.5em; overflow: unset; text-shadow: none; transform: none; width: auto; -webkit-box-reflect: unset;">提升评估准确性

ingFang SC", ui-sans-serif, system-ui, -apple-system, Roboto, "Helvetica Neue", Arial, sans-serif; letter-spacing: 0em; text-indent: 0em; white-space: normal; color: rgb(63, 63, 63); line-height: 1.8em; padding-top: 5px; padding-bottom: 5px;">可以通过以下方式或技术来提升评估准确性 (有可能会增加成本):

注:如要减少模型偏见,可以参考社会学中的问卷设计,然后根据使用场景来书写 prompt。如想使用模型来替代人工评估,可以设计类似的评价指标:如计算标注员一致性,使用正确的问卷方法来减少偏见等。

不过在实际应用中,大多数人并不需要完全可复现且高质量无偏的评估,快速且略显粗糙的 prompt 就能满足需求。(只要知悉使用后果,这种情况也是能接受的)。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5