人类完败！斯坦福新研究爆 AI 创意超人类专家

显示全部楼层

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">斯坦福大学的研究团队刚刚发布了一项爆炸性研究！

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">他们发现大语言模型（LLM）生成的研究创意比人类专家更新颖！

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">没想到AI不仅能写论文，现在连研究创意都能甩人类专家几条街了？

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">你可能会好奇这项研究到底是怎么做的？结果靠谱吗？

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">一起来扒一扒！

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">首先，研究团队可没有随便找几个人来充数。他们招募了49位NLP领域的顶尖专家，让这些大佬们在7个NLP主题上提出新颖的研究创意。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">与此同时，他们还训练了一个LLM智能体，让它也在相同的7个主题上生成研究创意。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;letter-spacing: 0.75px;text-wrap: wrap;background-color: rgb(255, 255, 255);">等等，别以为这就完了！

为了保证评审的公平性，研究团队又找来了79位专家，对所有的创意进行匿名评审。

这阵容，堪称是学术界的春晚啊！

说到这些"专家"，可别以为是随便找的。

参与的研究人员来自36个不同的机构，大多数都是博士和博士后。他们的引用量中位数高达125，评审专家的引用量中位数更是达到了327！

可谓是学术界的梦之队啊！

为了确保人类和AI生成的创意都能涵盖所有必要细节，研究团队还制定了一个超级详细的创意模板。他们甚至为每个创意支付了300美元，还给出了1000美元的奖金给最佳的5个人类创意。

啧！学术界的"非诚勿扰"啊！