大家晚上好,我是蓝色蒜头。
2024 年 1 月 19 号,短播客第 70 期

昨天谈到了 ELM
其中提到,人们在处理信息的时候
会根据动机和能力的不同
动用「中心路径」或者「边缘路径」
两套处理模式

稍微有一点晦涩啊
暂时没有跟上的朋友可以先去听前两期内容

今天要继续展开的是
恰好,在经济学,或者说心理学领域
也有着快慢思维系统的概念

这种概念,恰好又可以对应到 ELM
模型里的「中心路径」和「边缘路径」

快慢思维系统的概念
大部分人其实都有一定的认知
只不过在很多情况下叫法不一样

我们说的最多的形容这两种系统的词
就是「不假思索」和「深思熟虑」

当我们去评估自己的所有思维
「不假思索」和「深思熟虑」
其实是不难区分的

认知这两种思维状态并不难
但是要仔细分析

什么情况下,人会不假思索而动用快速思维系统
什么情况下,人会深思熟虑而动用慢速思维系统

人在快慢速思维过程里
分别会怎样去动用记忆能力,推理能力,计算能力
以及在一些涉及操作的场景里,去做复杂的身体运动
要解答这些问题,需要动用很多研究方法才能得出结论

之所以把 ELM 和快慢系统放在一起提
是因为两者是在不同情况下
针对不同目的提出的模型和概念
但对于「不假思索」和「深思熟虑」这两种思维状态的
定义、分辨、解析,两者有很多相似之处

不过这不是今天蒜头这一期播客的重点
这一期我们又从这一条线索回到了 AI 上

从 2023 年年中开始
人工智能领域其实就在做这样一些思考和实践

也就是人类的快慢思维系统
对于人工智能的体系构建和应用
会不会有什么帮助

整个的推敲,讨论过程
涉及数理逻辑的部分
表述起来比较晦涩

这里说一些比较容易理解的观点

其实如果就通过训练形成的单一模型来看
不管是语音识别、人脸识别这样的小模型
还是大语言模型,例如 GPT 这样极度复杂的大模型

它们对于输入的信息进行的反馈
在工作机理上,非常类似人类进行的快速思维

也就是说,如果 GPT 单独工作
不给他任何补充的外部信息
也不让他调用其他的专用模型
那么 GPT 产生的所有回应
拟人的来说,都是快速思维模式

2023 年上半年
很多媒体在渲染 GPT 多么厉害的时候
会举一些像回答百科知识问题
模仿谁的语气写一段话
做总结摘要
写一段程序代码
这样的事情

其实当时营造的情绪,在我看来有点过分了
反而在下半年导致了很多人的回头质疑

为什么说它过分
首先,他们当时列举的那些例子,其实都是过于单一的任务
媒体由于不懂得各个领域的真正麻烦在哪里
把一些单一的任务说得意义过大
以至于让具体领域的很多人反感

有的人可能会说
这些领域的人之所以反感
是因为看到 AI 强大了,担心自己被 AI 取代
这种观点是错误的

最开始的反感,其实是
明明这些媒体举的例子都很简单
放在具体的领域里来看什么都算不上
但是却要按着大家的头,说这些多厉害多厉害
这才是各种领域的专业人员最反感的地方

其实对于很多专业人员而言
真正有更强大的,能把专业问题解决的更好的
不管是其他人还是人工智能
因为更好而把自己替换掉了,至少在自己的职业操守这方面
不会有什么怨言

但是你指着水平很一般
无非是领域外的其他人不容易分辨的一些例子
说这些就很强了,这种对于专业人员是一种侮辱

从另一个角度而言
哪怕是对于各种并非处在专业领域里的人来说
这种媒体渲染仍然是有害的

上半年围绕那些过于简单的例子
说得有些过火,把期望拔得太高
以至于到了下半年,围绕代理模式,多智能体模式
真正开始做了一些有意思的事情

很多领域的专业人员都开始认真考虑
怎么去整合、适应的时候

公共话题领域里
很多人反而已经麻木了
甚至觉得就是一直吹牛,一直炒概念了

一开始造就不思索的狂热
然后带来不思索的反智

这就是媒体议题设置的恶果

回到快速思维模式上来
为什么说 2023 年上半年的那些例子
在各种专业人员看来,过于单一

原因就是,模型的运作对应的这种快速思维
其实很多专业人员,通过长期的训练和实践
也可以做到

举例来说
我们中国人,基本从小都是从九九乘法表开始学习数学基础
九九乘法表,按计算机的术语来说
其实是一种映射表
直接把输入对应到输出
我们在头脑中建立起了对于九九乘法表的记忆
这样在进行个位数的乘法运算时
我们调用的大脑区域,其实只有记忆单元
而没有运算单元
这就是快速思维系统

而对于一些心算高手而言
经过长期训练
两位数,三位数,甚至更多位数的乘法
他们都能做到调用快速思维系统

再拿我们 TNA 的观众熟悉的游戏速通来说
很多速通过程里,玩家会在非常短的时间内
完成很复杂的操作,而按键节奏又很精准

也就是因为,通过长期的反复训练
他们去执行这些操作,已经是通过快速思维系统了
不需要动用多余的大脑区域

我们社区有一个有意思的说法,叫脂肪记忆

2023 年上半年,媒体渲染的那些单一例子
都没有超出各种专业领域的人
通过快系统能做到的事情

而每个专业领域最复杂的那些事情
要么是最前沿的,具有探索性质,没有标准答案的
要么是跨领域的,需要不同专业素质的
要么是需要团队协作,除了专业能力,还需要协作方法的

如果 AI 没有在这些事情上给出足够的说服力
那么不可能得到专业人员的认可

如果团队负责人
或者说企业老板
没有意识到这个层面

光是看那些单一的例子,就开始盘算
团队是不是可以开始开除人,换成 AI 了
结果一定是不会好的,一定是会影响效益的

2023 年对于 AI 大模型的探索
得出的一个重要结论就是
在现在的大模型构建方式下,哪怕进一步扩大训练规模
增加神经网络数量

单一的大模型,也没有办法去应对
上面说的三种复杂因素

所以其实在去年下半年
如何把慢速思维系统的特征结合进 AI 体系
已经是所有人的思考共识

但到这时候,多数媒体要么已经是放弃跟进
要么始终围着 openai 一家公司更新的表层功能去不停的吹
要么已经开始去做教人怎么去用 AI 做视频这种卖信息差的课程

几乎没有媒体去谈论正确的
大家真正都在关注的事情

由于蒜头自己花了很多的时间进行 AI 集成的实践
以及每个星期都和一些专业的朋友沟通探讨
在去年,整个事情的演化脉络算是基本没有错过

其实就可以说
在 23 年下半年
从思维链 COT Chain of Thought 开始
围绕 agent 代理,围绕多智能体的那些新模式的提出
从一个概括性的角度来衡量

就是计算机工程界普遍意识到
仅仅通过单一模型,只能构建类似快系统
而快系统具有非常大的局限性

在当下没有出现新的 AI 构成方法之前
就基于现在的大模型,或者说大模型底座

必须要引入慢速思维系统的特征
才能够去涉及那些真正有价值的、实用的领域工作

在前几年的一些时期
一些比较极端的想法
已经开始否定在这一轮人工智能实践之前
出现的一些知识建模方法
例如本体论 Ontology,以及相关的推理方法

认为只要扩大模型规模
就可以抛弃这些概念体系,做成一种更简洁一致的智能系统

这种想法是可以理解的
我也相信到了未来某个时候,必然会出现简洁一致的
比现在更强大的智能系统的构建方法

蒜头播客去年解读过约翰卡马克的访谈
他其实就是期望能够去推动这样的事情

但是,一旦具体到当下的工程场景
目前这么说还有些操之过急

2021 年我在一些严肃的多团队参与的项目的技术选型上
和其他一些团队有过激烈的争执
就是围绕是否应该在复杂知识系统里整合推理机

到了 2023 年下半年,我想工程领域至少有了当下的共识
无论是推理机,还是其他一些可能被认为更「过时」的程序模块或者应用

从现实的角度来说
都应该以慢速思维系统的特性
去和大模型的快速思维系统进行整合
形成的结果,就是多智能体

有人说,为什么必须要整合慢系统
不能把更多的知识,所有的可能的知识和经验,统统融入快系统吗

蒜头这里举一个简单的例子
告诉你,从数理逻辑上来说,这是不可能的

我们前面说到了九九乘法表
九九乘法表通过快系统运作时
我们相当于在大脑的快速记忆里记住 81 组结论

心算高手,可以记住二位数,三位数,四位数的更多组结论
但是再多呢,多到一定程度,就超过大脑生物限制了

哪怕大脑没有任何限制
但是乘法的位数是没有上限的
换言之,不可能仅仅利用快速思维系统,去处理任何可能的乘法
但是,如果我们知道了乘法的运算规则,用逐位运算的过程去做乘法
就可以去进行任意多位数的乘法

而这种运算过程用程序表示起来
并不需要多长的程序

乘法位数短的时候
用映射表去处理,可能比这样的程序更省计算资源

但位数一旦变多
这种程序反而是效率更高的

放在大模型上就是这样
哪怕说算力可以无限提升
但是通过训练把各种信息做进快速系统
也不可能处理所有的问题
因为问题是无穷尽的
而很多的特定无穷尽问题可以映射到有穷尽规则上

一些特定的问题,反而是传统的程序,比大模型有效率的多
节省运算资源的多,那么,当然就需要进行整合

并且,人同样作为这些多智能体中的
从工程角度来说,平等的一员
参与到多智能体的运作里

这也会是 2024 年,至少在上半年
大部分的前沿团队都会积极推进的一种 AI 体系

这种体系倒并不是一种为了去兼容更多旧实现
而要进行的妥协

其实反而是大家都看到了通过这样的整合
产生 1 + 1 大于 2
N 个 1 相加大于 N 的一种可能
看到了一些能够在效率和成本上,对于真正的复杂问题
需要协作的问题,能够有所突破的一种希望

在整个历史上
计算机程序也许从此就有机会
不再是作为工作流各个环节涉及的工具
而是作为工作流的协作节点
和人的地位开始并列

当然,悲观的说
是工具成为人,替代人
还是人进一步继续异化,沦为工具
还是工具和人在未来形成一种当下不易理解,难以接受的共存状态
这些都有待继续观察

但至少 2024 年在这一块的推进
几乎没有任何阻力可以阻止

今天是周五,蒜头的播客在工作日更新
那么我们这一周的内容就结束了

这一周我们从 AI 的使用形式开始
聊到了议题的扩散传播,以及 ELM 认知模型
最后我们又回到了 AI 这件事情上

对于蒜头来说
AI 是信息技术
媒体议题是信息传播
电子游戏是信息的探索和利用

它们其实是非常接近的一些事情
所以蒜头会在自己的播客频道
把这些事情穿插在每天的内容里讨论

希望给你一些独特的视角

好的,今天就聊到这里
祝大家进步,祝大家周末愉快,我们下周再见!