当我看到山姆·奥尔特曼说这个新模型情商特别高时,我抱着极大的期望,立马去测试了一下。
在ChatGPT的产品界面,模型切换菜单里,GPT4.5下面的小字写着“擅长写作和构思想法”。于是,我从一些日常沟通问题到专为程序员设计的“送命题”都测试了一遍。
先给大家个结论:所谓的“高情商”,其实只是相对OpenAI其他普通模型而言。我给大家举个例子,想象一下我们去了一所美国中学,看到一个九年级的学生自称全年级数学最强。你带着崇拜的目光翻开他的作业本,结果发现上面做的题目,居然相当于我们国内海淀区小学三年级的水平。
举个具体的问题给大家看看。这个问题是:“如果你是程序员,女朋友说‘随便吃点’的时候,你应该怎么做?”我分别问了一下o1 Pro、GPT4.5和DeepSeek这三款模型。
我从里面随便截取了几句话,看看三个模型的差距。截图我放在了文章末尾,感兴趣的同学可以点开看看。
第一个是刚刚发布的GPT4.5,因为没有推理能力,所以回答速度最快。当然,这也可以用一句当年我数学老师,经常说的那句充满了正能量的话来形容,“你动动自己的脑子啊”。
GPT4.5的回答是,作为程序员,面对“随便吃点”这种情况,你可以用两种方式来处理: 第一种方法是提供选项。虽然“随便吃点”听起来不太明确,但其实是一种间接的决策,意思是她希望你来做决定。你可以列出几个选择,比如:“你想吃中餐、日料还是西餐?”让她在有限的选项中挑选,减轻她的负担。 这个回答看起来确实像是个找不到女朋友的程序员给出的。
而o1 Pro模型就显得更懂人情世故一些。它是这么回答的:“如果我是程序员,面对‘随便吃点’这种情况,我会理解为她的一个模糊表达,可能意味着她没有特别的偏好,或者她希望我主动做出选择。作为程序员,我可以把这当做一个‘小任务’,通过一些分析和解决方案来应对。”
具体怎么做呢?了解她的口味偏好。虽然她说“随便”,但我会想想她最近喜欢吃什么,或者之前提到过想尝试的餐厅和菜式。比如,“你最近说想去那家意大利餐厅,要不要去那儿?”
然后就是DeepSeek的回答了,它给了一个完整的解决方案,开头就指出,女朋友这种问题,就是典型的“薛定谔的随便”,关键是要用代码思维来拆解需求。
第一步,要提供有限的选择,避免开放式提问。不能问“你想吃什么?”,而是可以说:“宝贝,我查了三个方案:A方案是你上次说想试的日料店,车程15分钟;B方案是楼下新开的酸菜鱼(步行5分钟);C方案是我煮碗豪华版泡面加溏心蛋(立刻能吃)。你选哪个?我优先执行!”
看到DeepSeek的回答,尤其是在看完GPT4.5那个寡淡无味的回答后,我脑海里突然浮现出《让子弹飞》里的姜文,满嘴飞沫地大喊:“你给我他妈的翻译一下,他妈的到底什么是他妈的惊喜!”