晚上好,我是蓝色蒜头。
2024 年 2 月 20 号,欢迎收听短播客第 84 期
今天接着昨天的话题继续谈专业的领域知识
现在的专业领域
恐怕比每个人预想的还要更多
我们常说隔行如隔山
其实到了现代社会
哪怕是普遍认知上的一个行业
一个领域
在内部细分下去
细分出来的各个部分
可能也是隔行如隔山
比如说我们熟悉的电子游戏领域
单机主机游戏
网络对战游戏
氪金手游
这些真的细分下去
其实其中的从业者认知差别非常的大
外部的人看来,大家都是电子游戏行业
但是在其中的人其实清楚
哪怕是这 些细分领域
说隔行如隔山绝不为过
我们其实非常担心外行指导内行
当然啦,如果外行愿意提供所有的资源和报酬
内行并不是不能考虑被指导
本想大声的斥责
但是钱给的太多了
实在无法拒绝
所以说,提前约定好利益关系且不反悔
那就什么都好说
就怕外行一边在消耗资源
一边在指导内行
放在人工智能上也是这样
任何团队,任何专业领域的专家
肯定都不愿意说,花了大价钱,可能还买了高算力
做出来的辅助人工智能,最后实际上是一个外行
这个问题其实很严重
毕竟在当下,搭建一个用来辅助工作的智能程序并不容易
有着很大的沉没成本
不仅是设备或者程序部署的成本
也有团队与之配合,调整团队工作习惯的时间机会成本
当然有人会觉得
哪有那么多专业的工作需要专门处理呢
都直接用 CHATGPT 不是已经足够了吗
现在还有这个观点
就建议听听蒜头以前的播客
重点推荐第 21 到 24 期
时间还过得不久,内容依然有效
总而言之
如果你在任何领域认知到什么是真正意义的专业性
并且你又实际试用过和 GPT 这样的大语言模型对话
尝试解决真正的工作实质问题
而不是仅限于对付总结报告
你应该会认同要在专业领域做智能的落地
还真的必须要对现有的智能补充额外的领域专业知识
上一期其实就是在讲这个内容
这一期要谈的是
什么是领域专业知识而什么是通识知识
我的区分比较简单
如果说一个信息,一个概念
离开了某个专业领域,在不知道它的情况下
不影响领域之外的其他任务的进行
这个概念就是领域知识而不是通识知识
举例来说,闭包,泛型,反射
如果不做代码编程的话,不知道这些也不会有任何影响
但应用程序可以通过网络来下载
这看起来也是计算机术语
但实际上是通识知识
因为如果对这个概念都一点不理解的话
使用手机可能都会成问题
这里要注意,理解概念不等于理解原理
随着时代的发展,原来有些领域专业知识
会因为一些工作生活方式的改变
而变为通识知识
例如键盘打字,曾经是专业知识
而现在应该是通识知识
所以,由通识知识到专业知识
其实并不是那么泾渭分明
但是,肯定可以从非专业向着专业的方向一直延伸
从对专业一无所知,到这个领域的顶级专家
掌握的知识当然不同
今天我们要思考如何去构建专业领域知识库的问题
就必须要考虑
从一无所知,到顶级专家
这中间的知识有没有层次划分
怎么做层次划分
如果不考虑这个问题
就很难在工程层面去定义一个专业领域的智能
期望它要达到的专业素养
是想让这个智能体去替代或者辅助小工、学徒
还是想让这个智能体去替代或者辅助大师
要做的事情绝不一样
理论上来说,任何领域替代大师也并不是不可能
比如说最强的围棋程序现在棋力超过人类顶级九段
但这只是理论
因为具体到其他的领域
领域场景的表述,涉及的因素比围棋的局面表达起来更复杂更繁琐
不能套用围棋智能的构建方法
一定要具体到领域
在我们具体的实践里
很多时候,我们并不是想花大价钱打造一个水平和领域顶级专家相当的智能体
而是会考虑退而求其次,花小价钱打造一个可以辅助领域学徒、小工的智能体
在这个过程中,我们要准备的知识库,从低水平到高水平
所要准备的,要灌入的知识就对应不同的层次
根据蒜头自己的实践经验
以及接下来要继续延续的实践方法
蒜头会把各种领域的知识大体上分为四个层级
由低到高分别是
第一层,概念和术语
第二层,观察和现象
第三层,通用的标准处理过程
第四层,个人适用的个性处理过程
光说名称比较含糊,这里做一些解释
第一层,概念和术语
非常好理解
就是用来描述这个领域内一切知识的基本语言要素
术语的存在不是为了假装高手
而是为了对话更短、更一致、更没有歧义
术语最大的意义是提升领域内的沟通效率
减少沟通误解,用术语表述出来的内容
基于术语大家能产生一致的理解,进行一致的行动
人工智能所依赖的知识库
灌入概念和术语基本上是必须的要求
否则它和人就没有办法以合理的效率进行协作
会非常啰嗦,且总是说错话
第二层,观察和现象
说白了,就是站在这个领域的视角
要应对的现象,要处理的问题
通过观察并且以术语把它们描述出来
任何领域都不是固化的,都会有所发展变化
会面对新的外部环境,会和其他领域产生交错
这些变化都会不断的补充新的观察和现象
第一层和第二层都属于认知的范畴
对于任何领域,充分了解了第一层和第二层的知识
起码可以说充分的把握去谈论或者转述这个领域内的各种信息
不会在描述上出现非常大的偏差
但是这还不够,因为这是认知的范畴
但是没有到达行动的范畴
也就是理论还没有抵达实践
所以有了第三层,通用的标准处理过程
蒜头非常喜欢用标准处理过程这个说法
它的英文缩写是 SOP - Standard operating procedure
这个词原本的意义比较狭窄
一般指的是一些行业工作手册上的标准作业步骤
在智能时代,其实这个概念可以扩充
人工智能特别擅长提取信息中的模式
以及特别擅长把各种操作方法拆解成更细微的可重组的步骤
当专业领域的人工智能助理告诉人应该怎么做
先做什么,后做什么
或者在一些步骤上帮助人直接就做完了
其实就是在不断的重新组织这样的步骤
而这些步骤的组合,就是广义上的 SOP 标准处理过程
为什么这里说的是通用的标准处理过程
通用,意味着适用于各种人
当然,也不是随随便便的人
而是掌握的前面说的第一二层级的基本认知
以及进行过必要的基本练习的人
也就是一般意义上的学徒、小工
学徒、小工最缺乏的往往不是认知
而是经验,如果一个与之配合的人工智能助理
可以提供确实可以执行,可以一步一步来的操作步骤
那么将可以和学徒、小工进行非常好的配合
当然如果不是配合,而是替换掉学徒和小工
也是同样的逻辑,无非是智能是仅提供建议,还是直接参与执行的区别
而在实现原理上没有差异
其实如果说能够以一二三层级去完整的构建知识库
以及支持一个智能体,已经是一个比较理想的结果
这样的智能体整合到团队的工作流当中,已经足以产生效率的飞跃
然而还有第四层级
个人适用的个性处理过程
领域知识到了这个层级
已经开始向着专家和大师迈进
顶级专家之所以能够称为顶级专家
是因为他们在这个领域会有专属于自己的理解和实践方法
这种实践方法是他们在充分的理解了前三层的领域知识
并且充分的理解了自我之后,产生的个性化经验
这些经验很可能只对他们自己的工作过程有效
而不能作为一种通用的 标准处理过程 来传递
我们来举一个具象的例子
小提琴演奏
基本的乐理知识、乐谱概念
演奏手法,这些是第一层级的知识
各种曲目,音乐的欣赏
各种演奏风格,演奏的礼仪
围绕小提琴的趣闻轶事
等等,可以发散关联到的一切
这些都可以是第二层级:观察和现象
小提琴如何独奏
如何协奏,在交响乐里如何与指挥和其他乐手配合
如何完成一个完整的演出
这些是第三层级:通用的 标准处理过程
充分掌握前三层级
就已经是一个合格的专业的小提琴乐手
但是像大师帕格尼尼那样
在琴弦断裂或者故意炫技的情况下
只用一根 G 弦去完成完整的演奏
这就是专属于他的个性处理过程
贝多芬在耳朵听不到的情况下
去演奏,去作曲,这些过程也只适用于他自己
这样的个性处理过程对于
他们之外的其他从业者并没有太大的参考意义
也没有必要去模仿重复
为什么昨天的上一期会说
专业领域的顶级专家其实很难去配合智能体的知识库建立
其中的一个原因就在于这里
这些第四层级的个性化的处理过程
一来可能不容易脱离他自己的体验来准确描述
二来其他人也很难在没有对应的个人特质的情况下简单重复
比如说摄影大师也许可以做到不用三脚架拍长曝光
但是摄影的标准处理过程,还是必须建议使用三脚架
大师自己是如何稳住的,这个经验其实不太容易传达细节
其他人的身体稳定性也未必能做得到
因此蒜头在这里的思考是
如果我们要去以合理的成本构建可用的
可以配合或者替代领域内多数平均水平的人
去完成多数工作的智能助理
其实并不一定要引入第四层级的知识
如果承认这个前提,那么就意味着
并不一定要在整个的智能体搭建过程中
需要顶级专家的全程参与
但是也不能只由对这个领域一无所知的人参与
其关键的划分点,其实就在第三层级的知识
如果我们能在各种领域比较精准的定义
前三个层级的知识,以及准确的找到对应的可以配合的人员
那么就有可能在具体的领域去实现高可用的人工智能助理
那么至少到现在,就有了一条也许可以进行工程推进的路径
但是,又要回答两个新的问题
第一,前三个层级的知识很难准确划分,无法找到准确对应的人
或者具体领域的工作实在太忙,人手实在太缺,稍微能干活的人都上前线了
没有人有闲暇来配合,怎么办
第二,如果说始终没有顶级专家的参与。最后做出来的智能体有多大的说服力。
如果智能体的水平有限,是不是最后又会掉到提升规模,降低质量这条路上
那么和蒜头昨天上一期在最后的说的,我们的目的是提高质量
把专业领域变得更丰富,更好,是否有所矛盾
所以话题依然没有结束
我们要在明天、后天接下来的两期里
分别讨论这两个问题
请感兴趣的朋友继续收听
以及在评论区进行探讨
我们今天就聊到这里
祝大家进步,明天的工作顺利,再见!

