链载Ai

标题: 万轮实测：GPT-4.5 不如 GPT-4 [打印本页]

作者: 链载Ai 时间: 2 小时前
标题: 万轮实测：GPT-4.5 不如 GPT-4

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;">是我喷得保守了，觉得 GPT-4.5 只是贵&慢，但模型总归是素质在线。　

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;">没想到，经过实际数万论实测：GPT-4.5 还烂　

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;">经过总计30291 次盲测投票后，发现绝大多数人，一边倒喜欢 GPT-4

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;">这个盲测，是赛博菩萨 Andrej Karpathy 发起的，他先带着大家回顾了 GPT 系列的发展历史：

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;">GPT-1 只能产生基本连贯文本，GPT-2 还很混乱，GPT-3 更为有趣
GPT-3.5 达到可商用水平并引发"ChatGPT 时刻"
GPT-4 带来了微妙但全面的提升（更好的措辞、理解能力、类比、幽默感等）。

那么很显然，我们会认为 GPT-4.5 一定会更好：尤其是在"情商"相关任务（世界知识、创造力、理解力、幽默感等）上会有明显改进。　

因此，为了评估这些非推理能力，Karpathy 设计了 5 个有趣的 prompt，并拿这个去问 GPT-4 和 GPT-4.5。所获得的答案放在 Twitter 上做了一个公开投票：让用户在不知情的前提下，投票比较哪个输出更好。　

先给你看看这 5 个问题是啥。　

问题一：创建一个 GPT-4.5 和 GPT-4 之间的对话，其中 GPT-4.5 以玩笑和讽刺的方式嘲笑 GPT-4 的能力不足，导致 GPT-4 幽默地尝试为自己辩护。