晚上好,我是蓝色蒜头。
2024 年 1 月 16 号,短播客第 67 期
这几天电子游戏领域没有太多的话题
除了一月底到二月要发售的新游戏前瞻之外
就是育碧刚发售的银河城游戏《波斯王子·失落的王冠》
Speedrun 社区组织了一次有奖金的速通投稿竞赛
国内这边,有不少 TNA 认识的玩家都在参与
这些蒜头播客都过一段时间再去讨论
游戏话题不密集的时候
就还是继续来谈信息技术和人工智能
在第 65 期谈 AI 与游戏开发的时候
有一位朋友:ID 是 表面Clockface
在评论回复里提出的一些观点
我觉得很有意义,可以展开探讨一下
这位朋友认为,AI 目前来说还算是混沌期
沉淀还不足,等再沉淀一轮
变得更加工具化以后
就会出现补习班等形式存在的 AI 工具使用教学
让各种领域的劳动者掌握这些工具技能
他打了一个比方
就像当年的会专门存在的打字学习班一样
打字被作为专门的手艺进行集中的培训
这一点现在的劳动者,如果没有经历过
可能就比较难以想象
当然啦,这位朋友也补充了
就在当下,好像确实也存在一些 AI 使用教学
比如什么教你 chatgpt 的这样那样的使用技巧
教你怎么用 AI 生成视频来躺着赚钱
之类的视频
大家如果关注了蒜头的播客
因为蒜头播客的节目标题和标签经常会带上
AI 人工智能
平台搞不好还会因此推给你这样的所谓「教学视频」
相信在这方面有关注,有思考的朋友
去年整整一年,对这类只有噱头而没有营养的视频
应该是比较熟悉的
这位朋友提出的一个点,我非常赞同
也就是,这些当下的所谓的「教学」
其实卖的是信息差,而不是知识或技能
蒜头这里解释一下
所谓信息差,就是过了这个当下,就不再有作用的这些信息
比如教你现在用 AI 去生成视频
你没有任何独特的思考或者都不参与制作过程
也不懂什么是视频质量
从文案到剪辑到配乐到朗读,全都给 AI 去做
能不能做呢
从技术逻辑上来说,当然现在肯定是可以的
确实能够产出这样的视频
但这样的视频发布出来
有多少人会观看
有多少人会持续的观看
平台会不会任凭这种视频泛滥
会不会通过管理方法、算法打击这样的视频
都会在很短的时间内产生迅速的变化
说句不好听的
很多人看到这样的所谓的「教学」的时候
其实里面讲的那些做法,效用已经过时了
跟着模仿去做,除了浪费时间
其实没有多少的收益
特别是有的这种视频的制作者
还故意卖关子,用我在第 63 期里说的
那些消费陷阱的做法,做成收费课程
把一些已经过时的无效的方法
包装成宝贝卖出去
他当然可以说有人用这种方法赚了多少
但是当他说的时候,这种方法已经不可以重复了
因为这只是有信息差的投机的做法
而真正能赚到大钱的那些信息差
没有人会第一时间告诉别人
没有人
真正的知识教学、技能教学
教的都是有所沉淀的
不会很快过时的信息
我之所以认同 表面Clockface
这位朋友的说法
也就是随着沉淀,会逐渐产生使用 AI 工具的教学
不过这种教学,可能不会直接叫做 AI 工具教学
而是混合在其他工作技能的教学里
举个例子来说
那种从零开始的,面向零基础的视频剪辑教学
在过去,肯定要教如何处理音轨
如何剪切掉录音的杂音,呼吸,重复部分等等
也肯定要教怎么给视频配字幕
这里就会用到专门的字幕工具例如 Arctime
但随着 AI 的进步
有一些工作流程,所用到的工具和操作方法
会发生变化
上面说的录音处理,在剪映最近推出的 5.0 版本里
已经有了智能处理录音人声
能比较好的去除杂音部分,重复部分
并且自动的把录音对应上文字
这些文字可以让它根据人声来识别
也可以通过原有的文案稿来对应上去
蒜头播客每一期的视频字幕
就是花一分钟的时间,这样把文稿对应上去的
效果非常不错
如果没有这个功能,蒜头播客应该也不存在
因为做不过来
当有了这样的工具
原来的一些既有的工作流程,工作方法
或者说工作技能的操作方法
就会发生直接的改变
作为与时俱进的教学
就应该去调整教学内容
这种对 于已有的课程的内容的调整
肯定要比专门去开设 AI 工具的教学
来得更加快速,更加频繁
也在短期内更加有必要性
当然长期来说
我们的观点是一致的
也就是当这些技术沉淀到最后
它的使用方法已经非常符合人的直觉时
以及人会在所有生活场景,而不仅仅是工作场景里
都非常频繁的重复这些使用方法时
这时就没有必要进行专门的教学了
比如打字这件事,除了那种速度有很高要求的速录员
其他人是不会去被教学的
因为生活里每天重复这样的事情太多
打字的输入法又比以前要好用的多
AI 工具到了最后也会是这样的一个内化的过程
因为它会渗透到整个生活里
这样的沉淀,现在当然还没有发生
一定需要一段时间,一段过程
和一些先决条件
需要有的先决条件 表面Clockface 这位朋友的观点是
AI 工具现在有一些黑匣子的问题
也就是它的实现原理带来的不可解释性
如果不能解决这种不可解释性
那么这种沉淀可能就不容易完成
这里蒜头的观点稍微有一些不同
首先我很同意现在的 AI 实现具有很大的不可解释性
简单来说,大模型的神经网络,其中的节点已经过多
超过了人类的分析能力,每个神经节点在训练的构建过程中
都是基于统计学意义形成,哪怕单独拿出来看
也不能还原到符号式逻辑推理的层面去解读
所以,传统的计算机程序
从输入到输出,其中的所有数据传递
数据转换,数据运算
我们都可以完全的还原,并且可以由人通过纸笔进行彻底复盘
但是对于 AI 大模型就不可能做到这一点
输入为什么会产生这样的输出
只能从概率上解释,而不具有逻辑推理的必然解释
说的有点复杂
总而言之,传统的计算机架构思维下
其实对于这种不可解释性会有一些担忧
所以,认为不可解释性会影响 AI 的进一步沉淀
这种观点是可以理解的
不过蒜头的考虑是
如果从工业化、自动化的角度而言
不可解释性对于进一步的 AI 应用沉淀
有一些影响,但不是最重要的影响
最重要的影响其实是可靠性、可控性
为什么说可解释性不是最重要的影响因素
因为其实仔细的考虑
过去的任何领域的工作过程里
人都是工作过程的组成部分
但人其实就是不可解释的
当代的生物、医学
无论是对于人的运动还是对于人的思维的工作原理解析
其实都比较的浅,显然还达不到精确到
每一个神 经细胞的逻辑意义的层面
一些尝试去解释人的行为、解释人的心理的学术研究
说白了,也都是基于统计学进行总结概括
一些人上午还过得好好的
还和朋友同事在聊天开玩笑
下午就自S寻短见
这样的事情我们时有耳闻
很多时候,也得不到很有说服力的解释
我们在所有的工作流程里
对于人的信任,不在于人的可解释性
而在于人的可靠性和可控性
可靠性是,交给他的某一类任务
他会按照要求,在可预期的时间里
以可预期的较为稳定的质量
来完成
可控性是,不用去反复的重复细节要求
以及不用反复的去强调规范
以较少量必要的信息指令
就可以让他去完成较复杂的工作
在任何职业领域
所有打工人,只要持续满足这两个条件
被称为职业化的人,就没有多大问题
至于能不能升迁,能在这个领域做到多深
牵扯因素太多,这个我们这里就不展开讨论
我们在把工作交给人的时候
要么是上级对下级
要么是对于合作的同事、伙伴
这种时候,其实在意的并不是对方的可解释性
而是可靠性和可控性
对于可解释性的要求
可能更多的还是来源于工业时代之后
一些工作流程的机械化、电子化改进后
对于设备的要求
但哪怕是对于设备的可解释性要求
也不是全局的
简单来说,一些组装厂的产品
用到很多的不同的电路模块,电路板
开发各种程序时,工程师也会引用
各种各样的程序库
他们其实不需要去解释用到的每一个零部件的内在逻辑
每一个代码库的内在逻辑
也是只需要把它当黑盒对待即可
只要它本身是可靠的和可控的
所有电子零部件、代码库
当仔细去理解它的可解释性
其实说的并不是所有人在所有情况下都可解释
而是最初的开发者,或者技术负责人
在特定的要追责,要溯源的情况下能否解释
现在的 AI 模型
相比于传统程序,可解释性的差别其实仅仅只是在这里
这种因素其实并不影响各种工作流程去整合 AI
也不影响用 AI 去支撑新的生产用途
只要他可靠和可控,就不会构成很大的障碍
反过来说
现在我们对于 AI 的应用沉淀,如果说存在一些疑虑
多半还是因为它在某些时候不可靠和不可控
以我在以前的播客里举的例子来说
蒜头去年尝试用 AI 去做塞尔达传说王国之泪的技巧类文章翻译
就出现了很多的不可靠情况
比如说,对于同一个单词,每次翻译的结果不一样
即使我把大模型的温度这类参数调成 0
它也只能保证对于同一个段落,每次的翻译结果一致
并不能保证对于整个文章中,不同段落中出现的同一个词的翻译一致
并且,有的时候,会不理会原文,出现和原文没有任何关系的重复随机文字
标点符号错误,格式错误就更多了
虽然它对于英译中本身的语言流畅性可读性超过了过去的任何一种翻译程序
但是由于上面的这些问题,仍然不能做到理想中的翻译自动化
所有的自动化,都高度的依赖其体系组成部分的可靠性
由于可靠性不可能达到 100%,因此,任何的自动化系统
无论他用不用 AI,都需要因为不可靠的部分,因为损耗的部分而进行维护
很多对于自动化这件事情的过分期望
其实就是有意无意的忽略了维护成本
以上面这个翻译工作来说
如果 AI 可靠性百分比较低
整个工作需要支付的维护成本就会很大
最后综合下来,可能还不如不用 AI
这就是目前的核心问题
所有的 AI 范例,它都比以前最好的手段,做得要更好
但是 AI 如果不能在所有情况下,可靠性达到预期
那么它是支撑不起来一个体系化的自动化工作的

