链载Ai
标题: 选择合适的 llms 以实现最佳性能:2025 年最大化 AI 聊天机器人效能的指南 [打印本页]
作者: 链载Ai 时间: 3 小时前
标题: 选择合适的 llms 以实现最佳性能:2025 年最大化 AI 聊天机器人效能的指南
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">如何从 ChatGPT、Kimi、Qwen 等获取最佳答案
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;margin: 0.1em auto 0.5em;border-radius: 4px;height: auto !important;" title="null" src="https://api.ibos.cn/v4/weapparticle/accesswximg?aid=107121&url=aHR0cHM6Ly9tbWJpei5xcGljLmNuL3N6X21tYml6X3BuZy8wQ1NhRENqeEVKalVVUThwZjJpY1I5RDU3WWliQ1lrQVFSSzVKcVNxZFRORU5NSmZhTXNRUTR1MW16ckZpY24yNVZadnVGVGpzQW8yWExZOWt4elY2QXlpYVEvNjQwP3d4X2ZtdD1wbmcmYW1w;from=appmsg"/>ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">如何从 ChatGPT、Kimi、Qwen 等获取最佳答案ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">在人工智能的革命中,我们有许多 LLM,每个月我们都会看到新的 LLM 或现有 LLM 的更新版本。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">但我们不知道的是:ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;color: rgb(63, 63, 63);" class="list-paddingleft-1">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;text-indent: -1em;display: block;margin: 0.2em 8px;color: rgb(63, 63, 63);">•ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">哪个 LLM 能比其他更好地帮助我。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;text-indent: -1em;display: block;margin: 0.2em 8px;color: rgb(63, 63, 63);">•ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">我该如何与 LLM 讨论以获得最佳答案。
如何选择 LLM
实际上,LLM 的使用取决于您想要解决的领域和问题。
这意味着要识别您的问题属于哪个领域。
例如:
但我怎么知道我领域中更好的 LLM?

别担心,有一些组织评估 LLM,这被称为基准测试。
所以基准测试是一种用于根据 LLM 在不同任务中的表现进行评估和比较的测试。
由于 LLM 设计用于各种目的,基准测试帮助我们了解哪个模型最适合特定需求。
常见的基准测试包括:
- •HELLASWAG:测量 LLM 预测下一个逻辑句子的能力。
- •HumanEval:通过检查 LLM 是否能够生成正确的 Python 程序来测试编码能力。
评估示例
如您所见,Kimi LLM 在解决数学问题方面表现更好。


此外,模型的评估还取决于您使用的语言:


我该如何与 LLM 讨论以获得最佳答案
要从 LLM 获取最佳答案,您需要给出好的提示。
以下是关键策略:
1. 清晰具体
- • 而不是:“告诉我关于人工智能的事。”尝试:“解释一下变压器在人工智能中的工作原理,重点关注自注意力和位置编码。”您的请求越精确,响应就会越好。


2. 提供背景信息
- • 示例:没有背景信息:“总结一下这段文字 'your text'。”
- •有背景信息:“用简单的术语为电子商务初学者总结这段文字。”
3. 使用逐步说明
- • 而不是:“生成用于数据清理的 Python 代码。”尝试:“编写一个 Python 脚本来清理数据集:去除重复项、处理缺失值和标准化列名。”
4. 定义输出格式
- •“生成一个用于发票处理的键值对的 JSON 输出。”
5. 实验和迭代
- • 示例:如果答案过于技术性,可以调整为“用通俗的语言解释。”
6. 使用角色基础的提示
- • 示例:“你是一名高级人工智能工程师。向一名初级开发人员解释强化学习。”
7. 拆分复杂问题
- • 而不是:“告诉我关于无货源电商的所有事情。”尝试:“解释一下无货源电商的基础。”
总结:
在本文中,我探讨了如何优化与 LLM 聊天机器人的互动,以获得更好的答案。
我讨论了基准测试,它帮助评估和比较不同模型在推理、编码和文本理解等任务中的表现。
常见的基准测试包括MMLU 用于常识,GSM8K 用于数学,HumanEval 用于编码。
| 欢迎光临 链载Ai (https://www.lianzai.com/) |
Powered by Discuz! X3.5 |