晚点:为什么你觉得用户和大语言模型的互动是 “镜像效应”?
谢诺夫斯基:《经济学人》刊登过一篇文章,两位杰出的认知科学家分别使用 ChatGPT,一位认为它糟糕透顶,随机生成垃圾,根本不懂自己在说什么;另一位觉得它可能具有 “心智”。当你与它对话时,它会构建你的模型,预判你的思维方式,回复相应的答案。
训练 ChatGPT 的知识库几乎涵盖整个世界,包括过去数百年的文献和著作等。它能模仿任何作者的风格,扮演任何角色。所以当你开始对话时,它首先得判断:我对话的对象究竟是谁?这个人是否聪明?如果对方问题睿智,那我会对应睿智回答。因为我要模仿对方,努力提供与对方对话层次相匹配的答案。
但如果对方的问题荒谬,那它也会给出愚蠢回答。关键在于,若你事先不向 ChatGPT 明确告知你期望的回答方式,系统只会按默认的镜像模式回应。
晚点:你还认为 AI 在对人做图灵测试。(注:现代计算机先驱艾伦·图灵设置了一组问题来判断对话对象是机器还是人类。如果交谈后,你认为对方是人类,那它就通过了测试。 )
谢诺夫斯基:ChatGPT 早已通过图灵测试,它用英语表达时,句法结构完美无缺。语言学家告诉我们,句法(词语的组织方式与排列顺序)是语言的核心力量,意义是语言的最高层次,正是它让我们与动物区别开来。许多动物能通过警告信号等与同类交流,但人类能创造出复杂的词语组合,具有近乎无限的可能性。
ChatGPT 的语法能力远胜于我。我常犯语法错误,我们也都难免出错,它却从不失误。某种程度上,它比我们更聪明,没有人拥有如此广博的知识体系。它还精通多种语言,能处理各种复杂任务。
我意识到,某种意义上,它通过 “镜像效应” 测试提问者的水平。这相当于逆向的图灵测试,AI 在评判人类的智慧。
从机器人到类神经元芯片,AI 研究继续从人体寻找灵感
晚点:你在书里提到,AI 的记忆能力现在处于初级阶段,未来要想进步,可能取决于神经科学家对海马体和神经调节剂的进一步研究。能否为读者通俗解释 AI 和大脑在 “记忆” 问题的异同?
谢诺夫斯基:让我问你一个问题:明天你还会记得这次与我的访谈吗?
晚点:当然,会记得。
谢诺夫斯基:希望如此(笑)。一些人的海马体会出问题,导致他们记不起昨天,甚至 5 分钟前发生的事。这叫健忘症。事实证明,大语言模型也有健忘症。除非它们把对话内容存储在某种记忆系统,否则它们不会记得昨天和你聊过什么,也就无法利用昨天从你这里学到的东西。这叫长期记忆。相比之下,人类大脑在长期记忆上表现卓越。你仍能记起 10 年前的往事或童年点点滴滴。虽然记忆可能变淡,但那些形象始终萦绕在你的脑海。
大语言模型仅仅模拟了大脑皮层的极小部分。皮层之外,大脑还存在数百个其他脑区。这些庞大的知识库用于处理更复杂的问题,比如生存之道。因为生存的关键之一就是铭记过往经验,从而从中获益。这就是进化来的长期记忆。
正如你所说,大语言模型现在处于早期阶段,类似莱特兄弟的首次飞行。当时,莱特兄弟的飞机只在空中停留 12 秒、飞行距离约 36.5 米,但他们证明了载人飞行原理的可行性。早期飞机面临的最大挑战是如何精准操控飞行轨迹并避免坠毁。
这正是 “监管” 的本质:如何规范机器运行。在大语言模型领域,我们面临同样困境。解决问题需要时间。在飞机领域, 100 年后的今天,我们能乘坐它们环游世界。技术需要如此漫长的渐进式发展,才能达到高效且安全的境地。
晚点:现在神经科学处于什么阶段,对 AI 的进步可能有什么帮助?
谢诺夫斯基:我的博士学位是物理学,但后来我转向了神经科学。因为上个世纪我对大脑的工作原理充满好奇。当时的技术非常原始,每次只能记录单个神经元的活动。而我们的大脑拥有 1000 亿个神经元,数量极其庞大。如果逐个记录、逐项分析,不知要耗费多少时间。
过去 10 到 20 年间,技术突飞猛进。如今我们能同时监测数万个神经元,覆盖大脑数十个区域。现在我们能观察大脑整体活动模式,获得全局图景。
现在仍有大量未知领域亟待探索,我们远未真正理解大脑运作机制。不过在感知输入的表征机制方面,我们的认知显著提升。如今我们对运动系统的组织方式有了更清晰的认识——它是分布式的,它不像工程师设计火箭控制系统那样,由单一控制单元统管全局。
大脑是将实际控制权分散到多个区域,包括脊髓等。脊髓能与外界进行大量局部交互,比如手部动作无需大脑参与,可在局部完成。但当需要规划动作时,大脑会调动皮层,制定方案,再通过中间层整合出精确的手部运动轨迹。所有这些过程都在无意识中完成。
类似的,AI 的崛起也不是因为上世纪那种符号逻辑规则的框架,而是借鉴大脑结构——大量简单处理单元,但又高度互联的模型。我们创建了庞大的语言模型,也在深入探究其运作机制,解析其数学原理。它们虽如大脑般神秘,但我们终将破解其奥秘,毕竟是我们创造了这些模型。数学家理应能揭示其运作规律。
随着研究推进,我们将能借鉴对大语言模型的研究,来设计更有效的实验方案,揭示大脑运作规律。这就是 “神经 AI” 这一新兴领域的魅力所在。它汇聚了关注大脑运作的科学家与致力于构建更强大语言模型的工程师,实现了跨学科融合。
而在上个世纪末,两个学科毫无共同点,各自运用截然不同的数学方法解决完全不同的问题,进展缓慢。如今两个学科都取得飞跃性进展,发展速度极快。这无疑是令人振奋的时刻。