bilibili.com/video/BV19w411J7PM

星期一晚上好，我是蓝色蒜头。
2024 年 1 月 15 号，欢迎来到短播客第 66 期

上周五的上一期，我们简单讨论了
AI 会怎样被用于游戏开发
这样一个话题

在 2024 年，不止游戏开发
许多领域的 AI 使用
会进一步的推进

总体来说，目前来看会有三种使用形式首先出现

第一种使用形式针对团队内部的流程
是使用生成式 AI
也就是常说的 AIGC
GC 就是 Generated Content

用生成式 AI 来参与创造各种形式的内容
可以是由 AI 模型独立地根据要求来完成
也可以是人与 AI 协同
以新的工作流程来完成
具体的工作流程，就是各个团队要结合自己的能力情况去设计了

以美术工作为例，如果团队成员的美术能力很低或者很一般
那么工作流程中，可能会主要让 AI 来进行绘制
人的直接调整会比较少，更多的是反复修正要求
这样可以不用立即去招募一个专人
工作就可以以更低的门槛开展

而如果团队本来有美术能力很强的人
并且这样的人愿意去尝试摸索怎样和 AI 协作
那么就可以有不一样的流程
比如在构图、光影、颜色、细节绘制
等不同的方面，人和 AI 进行分工来完成最终的图片
起到的效果会是 1 + 1 大于 2

在这一点上，去年的播客里
比如 51 期、56 期里已经提过几次
对于一些关键的业务环节
优先考虑 AI 如何作为助理去补足能力
要比现在就考虑 AI 如何直接替换掉某些岗位
性价比会更高

这种使用形式，对应到游戏开发
也就大致是上一期说的预生成内容

第二种使用形式，是把 AI 整合到对外的服务环节里
根据领域的不同，有很多的表现形态
比如说人工智能客服
适用的领域就很广

在电商领域，目前其实已经都很广泛的在用了
效果也非常好
在没有现在这种人工智能的时候
许多客服已经是机械式的自动回复加上转人工的选项
现在过渡到由人工智能对话作为最初的沟通
非常的自然，碰到实在处理不了的情况
对话切换到人工处理，用户甚至感觉不到什么异常

而且目前语音合成技术已经非常好了
和对话模型结合起来能够顺畅的工作

一些电信诈骗、电话推销等场景
由于不用考虑转化率、业务稳定性等因素
上钩一个是一个，其实用的还更加肆无忌惮

前两年的垃圾广告电话
接起来的时候，他会自顾自的放录音

现在的有些广告电话
会跟你先寒暄几句
再根据你的对话节奏
更有逻辑地和你聊主题内容

我已经接到过不少这样的电话了
比以前的机械式的录音电话
迷惑性要强很多

好在现在缅北的电信诈骗基地
已经被打掉
不然因为快速的 AI 技术升级
受骗上当的人还要多出更多

在 2017 到 2020 年
我参与过医疗与健康智能服务的一个技术团队
当时开发的健康记录类产品里
包含不少的场景

其中一个典型的场景是
让用户根据自己的具体感受描述
或者具体的身体指标描述
来初步识别他的症状、可能的疾病
做一个大致的分流
然后让对应的专业的医生和他继续沟通

这个环节其实在不少的医院、诊所里都会有
称为导诊或者分诊，有专门的分诊台进行接待

当时没有现在这么好的语言模型
想在一个线上服务里去实现类似场景
非常的麻烦，要根据大量的关键词去编写脚本进行判断
整个过程需要开发者比较了解像 SNOMED CT
这样的医学术语集

当时我甚至开发了用于简化脚本编写的工具
让不具备编程知识的人可以更方便的参与脚本编写
也组织过几十个人的工作规模去大量的填充脚本
非常的费力

后来因为一些原因我不再参与那个团队
再后来，到去年，非常好的大语言模型陆续出现

当初那种实现方式，到今天就完全过时了
如果让我重新来做类似的事情
只要把 SNOMED CT 这样的术语集
和大语言模型整合起来

就能完成非常自然流畅的线上导诊服务
虽然从医学的严谨性、严肃性上来说
仍然存在很多的不可控风险

但是不管怎么样，都要比之前我说的那种脚本式的做法
用户体验更好，风险更小
主要是，实现成本要远远地更低

同样的产品功能效果
当时需要几十个人支撑的工作量
现在可能只需要几个非常熟悉编程的人来集成模型
非常熟悉医学知识的人来校验整个环节就能完成

它今天当然仍然达不到很多媒体吹嘘的那种
把人的期望无限拉高的完善程度
但是从工程实现的角度来说
特别是对于我这样的在大模型出现前后
分别做过具体工程实践的人而言
成本的降低、效果的提升实在是过于明显

打一个简单的比方
假设 AI 是一台起重机
媒体营造或者说吹嘘出来的期望里
它能举 1000 吨

理性的工程师的期望是，他能举 500 吨
过去的技术实现，要耗费很多的燃料来举 100 吨
现在的技术实现，耗费更少的燃料就能举 200 吨

工程师当然是非常兴奋的啊
因为更接近工程的期望了

但是媒体吹出来的那个期望
就不是理性的容易达到的

很多人盲目被现在的媒体议题操纵情绪
一下子真的相信了 1000 吨，过于乐观
一下子看到现在最多举几百吨，又觉得这东西不行，是吹的
这种就是非理性思考

如果这种非理性思考出现在团队的负责人身上
在接下来的这几年搞不好要付出很多的代价

比如说有的网站直接把编辑开掉
换成 AI 写文章
然后写的牛头不对马嘴，毫无逻辑
这个之前蒜头播客也喷过

但是，对于相关知识了解不多的朋友而言
区分什么是情绪化的、带目的的媒体议题
什么是理性的，有意义的科普
确实有一定难度

蒜头这里给出一些判断标准
第一、正反面都谈、优缺点都谈，这是理性的内容
报喜不报忧，从头吹到尾，或者报忧不报喜，从头黑到尾
这种是情绪化内容

第二、有过程描述、定量描述、引用来源的，比较可能是理性内容
否则是情绪化内容

第三、会随着时间推移而更新观点
且给出更新理由的内容频道
比较可能是理性内容
一直死守着某个同温层的、制造粉圈的频道
是情绪化内容

这些简单的判断标准不见得 100% 有效
但应该有些帮助
有必要的时候，蒜头播客再专门的聊一聊这方面
各位朋友也可以以这种标准来监督
蒜头的播客频道和视频主频道

说的有点远啊
刚才一直在说 AI 的第二种使用形式
多延伸了一些

像前面说的电商客服
医学分诊、以及生活信息查询
包括以后的银行柜台服务
行政办事服务，等等

都会陆陆续续地有这样的 AI 形式整合进来
来作为业务环节，对外提供对用户的服务支持

这种使用形式对应到上一期的说的游戏开发场景里
就是实时生成内容

刚才说的第一种形式是对内，用于补充团队能力
第二种是对外，用于支撑用户服务环节

第三种形式，我认为会是今年的一个重点
就是利用多智能体来自动适配复杂任务

这里有两个关键词
一个是多智能体
一个是自动适配

多智能体的概念，蒜头播客已经聊过多次
简单来说，每个智能体，术语可以叫 agent
就是具有不同具体能力的可整合智能单元

它可以不像人，可以就是一段传统程序
有固定的输入输出

可以像人，能够以自然的沟通去完成任务

甚至可以直接就是自然人，而不是程序

自动适配
说的则是

多种人或者非人的智能体
跟随任务的变化、需求的变化
在某种全新的，结合人工智能能力的
整体组织、整体调度、整体分解下
进行工作

这种组织调度
同样可以靠人，或者可以靠 AI 来做
最终人保留决策权，以及做风险评估兜底即可

这种形式和第一种形式的区别在于
流程是会去灵活适配需求的

而第一种形式，更多的是设计好的固定流程
来安排使用 AI 的环节

其区别就在于创造性和灵活性

在这种模式下去利用不同能力的智能体
迅速地形成快速反应小分队
去灵活的完成较为多变的创造性任务

做到比以前更高的效率
和更好的效果

为什么这里要把第三种形式单独区分出来
因为如果只考虑前两种形式
那么思维焦点，可能还是局限在
AI 怎么去降低成本

而只有第三种形式
才能做到利用 AI 增加效益
甚至到了最后
不一定会降低成本
但是只要效益提升，整体的收益就是有说服力的

也是技术革命需要完成的事情
不止降本、也必须增效

最近有一些视频频道已经开始做相关的科普了
比如我就看到有视频展示
组织多智能体去做自动的股票交易

这类视频整体逻辑还算合理
但是故事性、话题性偏重
对人的期望还是有过分的拉高

但不管怎么样
这肯定是整个 2024 年
所有要整合 AI 的团队
都一定会去实践的方向
也是当下最主流的方向

蒜头会保持自己的关注和实践
在播客里持续的做信息更新

以及会以电子游戏领域为主
来分享一些具体的案例和类比举例

今天就聊到这里
祝大家进步，这一周过得顺利，晚安，再见！

DAY-66 AI 在当下的三种使用形式