bilibili.com/video/BV1EW421N7UR

晚上好，我是蓝色蒜头。
今天是 2024 年 2 月 19 号，欢迎来到短播客第 83 期

今天是星期一，也是第二个正式的工作日
多数朋友想必已经复工
在这里再次祝各位朋友整个龙年工作顺利，取得进步

在接下来的几天，播客会把话题集中在人工智能领域
这里的探讨会分为两个大方向，

第一是在这一轮的人工智能技术发展逐步展开之后
可能会发生什么事情，以及可能会如何发生

第二就是在这个过程中可以做什么
包括思维方法上可以做的事情，以及可以进行的具体实践

今年整个一年，我想以这个频道的播客内容和
另外一个频道的视频内容一起来配合这方面话题的展开

播客内容会比较偏理念，视频内容则比较偏实践

今天想探讨一个话题，也是最近和我其他一些朋友进行过的讨论

人工智能在部分工作岗位或者说工作环节上
会替代一部分的人的能力，相信已经是一个共识

什么样的人，什么样的环节，什么样的能力
会被优先替换，则有各种各样的观点

蒜头其实一般不太喜欢往这个方向探讨
因为讨论不了多少，就总是会陷入
对于特定群体利益得失的情绪化之中
从而容易停留在低水平的讨论，很难有什么思想和实践收获

关于什么是低水平的讨论
可以去回顾播客的第 73 期，这里不再重复

目前有一个大家相对来说比较容易达成一致的说法
就是在很多领域，比如医疗、教育等等

由于领域专家，比如说很擅长诊断的医生是稀缺资源
AI 能够去复制这样的领域专家的能力
去构建出和专家能力类似的智能体，从而给更多的服务对象提供优质的服务

也就是说，通过机器智能去复制专家的思维能力、分析判断能力
来解放专家的时间，让这个世界上出现更多的专家

这种说法，逻辑上好像是合理的
但是蒜头其实并不完全同意

因为这个说法在工程上其实忽略了两个问题

第一，机器智能去达成和专家一致的能力
这个构建过程会是如何展开的，构建完成之后，是否只是专家能力的完全复制
或者说能否达成复制，如果不能达成精准复制，我们如何评判这种机器智能的能力水平

第二，一旦这样的机器智能达成了专家能力的完全复制
或者说达到了一样的能力水平
到这个时候，原来的专家在新的这个领域生态之中
会处于什么样的地位

如果不去考虑这两个问题，AI 恐怕在落地的工程实践会遭遇障碍
把这个问题想简单了的人，往往还是在以前几次工业革命一些想象去作类比
而没有注意到其中的差别

前几次工业革命，在工业自动化，流水线化的过程中
机器替代人，其实是有着非常明确的衡量指标

比如特定产品一天的制造、组装数量
良品率，品控稳定性

这些衡量指标并不难找
一旦说在多数甚至全部衡量指标上自动化机器超过人
那么从整体效率优化来说，在这个状态下，用机器把人替换掉是合理的

但是要注意，到了目前可能由 AI 驱动的所谓
第四次工业革命，这一次机器智能参与的各种工作

其实相比于前几次工业革命
在思维因素上、创意因素上、创造性因素上参与的
显然要更广更深

这里有一个极大的区别
其实对于这些思维、创意、创造性的工作
可能很难找到一些特定的指标去衡量机器智能的完成度

例如以医学专家来说
是否会有特定的明确指标去说明，某个智能体成功的复制了他的能力
或者说达到了和他一致的能力
这种指标非常难找

毕竟给人看病治病不能简单的类比成生产线上组装同样规格的产品
所有涉及思维的，涉及分析判断的，涉及创意创造的
服务对象是人的工作

都很难找到这样的统一衡量指标
包括医学、教育、法律、心理、设计
等等

而偏偏这些领域会是大众目前认为
AI 即将全面参与，即将呼风唤雨的领域

在我去年的很多沟通里
无论是这些领域内的真正称得上专家的人
还是领域外看热闹的人

都相信到了某个未来状态
可能还是不远的未来状态
AI 在这些领域内的表现一定会很好

但是，怎么从现在的状态一步步去推进到想象中的那个状态
怎么推进，过程中会发生什么
很多人没有思考过

而蒜头在结合我过去的经验
考虑了这个问题之后
会发现这中间存在一些难解的矛盾
甚至可以说是路径上的悖论

从原理来说
构造可以工作的机器智能
当下来说，不外乎三种方向

方向一，从头从零开始训练专用大模型
这条路，对于 GPT 这样的通识模型
走得通，但是对于领域专用模型未必走得通

一来训练成本巨大，算力要求极高

二来专门的领域数据在规模上远小于通识类数据
参考我在第 79 期里讲的阿尔法几何
正是由于训练数据不足，做了很多的额外的工作
这些用来补足训练数据的额外工作
是否在各种领域都能有类似的实践方法，目前打一个问号

三来特定领域知识在训练过程中要做的标注工作
其难度远远大于通识知识
可能需要了解甚至精通领域知识的人才能去进行标注
这样的人不一定非常好找

所以训练专用大模型几乎不太可能

方向二，基于现有的通识大模型，不管是 GPT 还是其他模型
通过微调，也就是 fine turning，加入补充训练数据去产生专用模型

相比于从零开始训练，这个确实可以节约训练成本和训练过程中的算力成本
但是对于专业领域训练数据的要求，其实和从零开始训练差别不大
越小众越冷门的专业领域，例如罕见疾病
其数据收集、清洗、标注从工程上则越难处理

方向三，不去改变大模型本身
而是把领域知识做成某种外挂的知识库
然后让大模型负责通识意义上的沟通、调度、规划
确定需要用到专门领域知识时，再去从知识库中检索

如果这样做，确实不用像前两种方法一样去准备训练数据集
但是构建外挂知识库，又会遇到其他的问题
解决这些问题的难度不一定比构建训练数据集要低
需要具体情况具体分析

今年 2024 年，比较顶级的公司和不缺钱的团队
可能会继续在方向一和方向二发力
以尝试追赶 openAI 或者在特定用途下抢得市场先机
这类方向产生的工作岗位在今年的待遇可能仍然会比较高

但是随着基础通识大模型出现了两到三个明显拉开身位的头部产品
并且已经固定了多数用户之后
其他没有追上的公司很快会放弃这个方向

像蒜头这样的没有什么资源的开发者
以及一些始终要面对生存压力的小团队
今年从理性上来说，多数应该优先选择方向三

也就是基本放弃大模型训练
只做小模型或者其他意义上的知识库、推理机
选择绑定作为底座的大模型，为其提供可以集成的智能体

回到我们正探讨的问题上
无论怎么样，方向一，方向二，方向三

在它们的实施过程中
对于领域专家的依赖其实都并不低

无论是构建训练数据集，还是构建其他形式的知识库
都可能需要专家密切的配合，积极的参与

这就产生了一个矛盾

真正意义上的专家本来已经是稀缺的人力资源
他们已经忙于自己本来的工作业务
连休息都缺乏时间，
怎么会有余力去配合这个构建工作

站在专家自身的角度
我已经要在百忙之中抽出时间去配合这些所谓的工程实施过程
我配合的越积极，越主动
模型或者智能体构建的效果越好

预期的效果就是复制我的能力
或者与我的能力持平
那么我的能力稀缺性是否下降了，甚至我是否会被替代掉

那么要我去积极的配合一个要降低我的稀缺性
甚至会替换掉我的一个工程实施过程
真的合理吗

真的要去积极的配合吗
毫无保留的配合吗
还是配合敷衍一下，或者干脆不参与

说到这里，就已经是蒜头要说的路径悖论
AI 在涉及思维的、涉及分析、判断、创造的所有专门领域
要真正落地，真正发挥作用

需要领域专家们的参与
但是整个过程，以及现在在大众的理解中
这个过程会导致的结果，可能不符合领域专家的个人利益

那么在我们了解的当下状态
到我们期望的未来状态
这样一个过程中

这样一个必然要进行的工程过程中
而不是随着时间推移自发发生的过程中

一般意义上的领域专家会起什么作用
是配合推动，还是无动于衷，还是以各种方式阻挠反对

同样打一个问号

当然有朋友会说，资本最大
专家算老几，我会想办法让你干，你不干有的是人干

说到这里我就总喜欢举去年的那个例子
国内某游戏媒体，不管出于什么考虑

把游戏编辑全部开除掉
用爬虫 + AI 延续原有的媒体业务

最后就在 AI 翻译或者撰写的文章里
出现《漫威蜘蛛侠 2》是《心灵杀手》续作的前作

这样牛头不对马嘴的句子

老板当然可以认为
这些游戏编辑无非是一个月写多少篇文章
我让 AI 来写，一样的啊，甚至写得更多

这就是我前面说
有人觉得可以以这种类似计件的指标去评价思维工作的成果

这种心态就是还停留在前几次工业革命
你可以这么想

但是你的服务对象不是傻子
你可以觉得某人不干，有的是人干，还可以让 AI 来干

但是用户同样可以觉得你的服务质量降低的话
有的是人提供更好的服务，我为什么要继续迁就你

当然有人会觉得这个世界上所有的服务质量都会越来越低
用户届时没有选择的权利，也会被调教的没有认知能力

所以其实现在对于 AI 接下来要产生的改变
就有了这两种理解

第一种理解是 AI 能以更低的成本提升业务规模
只要业务规模提升，质量下降也可以接受
也可以通过驯化用户来解决

第二种理解是 AI 应该要做的是更好的
比现在最好的专家都还要更上一层楼的服务
哪怕 AI 本身不能单独做到，也一定要让 AI 和人配合来拉高整体的水平

所以，当你看到那些 AI 做视频月入上万之类的所谓教程
它实际上在推动的是哪一种理解，这种理解能否长期成立
可以进一步思考

蒜头在所有场合，包括播客，包括我视频频道之后要发的内容
包括我在其他情况下和人进行的沟通

永远都会基于第二种理解的立场
也就是，人工智能应该把世界变得更丰富更优秀
而不是变得更单调更平庸

并且做好了准备，和第一种理解的人
打一架，甚至打很多架

回到今天的话题上
如果我们要沿着把世界变得更好这种理解上
去一步步推动人工智能的工程落地

那么必须要回答的问题，就是如何与现在的领域专家协作
如何获取现在的各种领域的专业知识
各种领域的专业知识五花八门，维度繁多

有没有一种相对一致的划分方法
去区分领域知识的各个层级
各个层级的知识在可能在工程的哪一个阶段引入
在过程中由什么角色和有什么能力的人去主导推动
是不是领域专家去推动，还是其他的人去推动

都值得深入的探讨

蒜头会在明天继续这个话题
聊一聊在各个专业领域

知识层级的划分
以及从知识层级的角度探讨专家为什么是专家
以及在人工智能的实施过程中
如何从层级的角度去思考推动力

以及说明为什么有理由相信
AI 会让各个专业领域变得比现在更好

今天我们就就聊到这里
祝大家进步，明天的工作顺利，晚安，再见！

DAY-83 AI 实现过程的路径悖论