早上好,我是蓝色蒜头。
2023 年 11 月 10 号,短播客第 22 期

今天接着昨天的话题。
继续做一做 gpt 和大模型的简单科普。
如果觉得没有接上,可以先听听昨天的第 21 期播客。
内容是连着的。

昨天说到,其实现在的各种大模型
不管多厉害
也不可能知道所有领域的专业知识

所以,一旦涉及到稍微具体一些的任务
比如电子游戏相关的内容
不管是翻译,还是做信息摘要
处理起来都会很不理想

特别是电子游戏领域其实还会往下细分
情况甚至比数学、物理、法律、医学
这些专业领域还要麻烦一些

举个例子来说
我现在有一篇《塞尔达传说·王国之泪》的
Any% 速通英文教程
也就是 speedrun guide

想要借助大语言模型翻译成中文
显然就翻译不好

现在的大语言模型在翻译方面
是不是比传统的一些翻译服务
例如谷歌翻译,百度翻译
有所改进呢

是有的
在语气、语法、遣词造句流畅度方面
比这些传统翻译工具要好了非常多

如果是日常对话的翻译
基本上不会有机翻的感觉

翻译社会政治经济类新闻
或者对这些新闻做摘要
或者重新组织
效果也都不错

因为不管是日常对话
还是这种常见的新闻内容
在大模型训练过程中
一定是输入的最多的材料

数量多到已经基本上
不会让它在这方面犯错

但是刚才说的电子游戏的速通教程
显然就不是那么回事了

第一,属于速通领域的术语很多
比如 Any%,一般不翻译
glitch 不能翻译成故障,最好翻译成邪道
或者看上下文有时也不翻
NMG 是 No Major Glitch
不使用重大邪道的缩写
显然不能指望每个大模型都知道这个缩写
还有像 EST SOB PB WR
这些术语,我们做科普视频的时候
甚至不会直接去用,生怕大家看不懂
这些术语,大模型基本都是不了解的

第二,属于特定游戏的术语很多
有时候,翻译必须按照官方的语言版本命名
而不能直接简单根据惯例翻译
例如王国之泪里的左纳乌装置 wing
不能翻译成翅膀,必须翻译成翼
因为中文版里,它就叫翼
还有 fan
翻译成扇子,风扇都不对
因为中文名称是「风扇机」

第三,属于特定游戏的速通术语非常多
比如王国之泪里的邪道命名
英文名对应英文缩写对应中文名

其中很多邪道和技巧
基本是像我们 TNA 速通会
或者塞尔达速通交流群
和 discord 交流群
同步沟通整理出来的

只有我们知道比较正确的一致的社区说法
这种资料,别说现在 GPT4-Turbo
哪怕到了 GPT20-SUPERSTAR
可能也没有这些训练数据

所以就这么一个简单的
速通指南翻译
在没有任何策略的情况下
去使用大模型来让他帮助翻译
帮助整理要点
帮助重新组织

基本是不太可能的

那么我们用什么策略才能让大模型帮上忙呢?
其实道理也不复杂

还是和昨天说的一样
用很呆板的方法
把参考资料整理好放在对话里一起给它

比如说特定名词的翻译
我可以整理一份翻译对照表

写成稍微规范一点的格式
比如 fan - 风扇机
Stick - 操作杆 这样

再整理一份速通术语表
再整理一份邪道命名表

当我让他翻译速通指南的时候
我就把要翻译的原文 名词表 术语表

都一起塞给他
大概会这样组织

请帮我翻译以下文章
这里贴上原文
这是需要你参考的术语翻译对照
这里贴上对照表
这是一些特定名词对照
再贴上对照表

就这样,有多少贴多少

最后的结果是,原文 3000 字
加上所有的参考资料,总共发了七八千字过去

所以为什么昨天说
虽然他叫 chatgpt
但是不要按聊天去理解

哪有这样聊天的啊
哪有一个聊天泡泡发几千字的啊

但是,大模型设计出来就是这么用的
由于他的算法实现原理
他读几百字和读几千字其实没有多大的效率区别

一样能非常快的把翻译结果反馈给你
虽然可能还不够完美

但基本已经到了只需要人
做少量校对就可以的程度

今年你会看到
有人做了 RPGMAKER 或者一些常见引擎的 AVG 游戏的 GPT 翻译插件
其实就是附上了常见的术语表来改善翻译效果

听起来好像挺厉害的
但是新的问题立刻就来了

由于现在的算力终归还是有限
所有的大模型一次传递的内容
都有字数上限

如果文章很长,加上各种参考资料
就更长,其实很容易达到上限

有人说
拆分成好几次发给他不就行了吗

其实是不行的
大语言模型本质上只是一个收到信息
然后反馈信息的黑盒
它本身是没有任何记忆的

我们看 chatgpt 的网页聊天
好像有一些记忆
其实也只是实现的时候讨了个巧
每次用户发新对话的时候
就把前几次对话和回复一起偷偷的作为参考资料
一起发过去
这样,他就会有一些比较短类似记忆
但是,一旦对话次数多了
就忘了之前说的是什么了

很多人用 chatgpt 网页版一直和他聊
到后面会感觉他经常忽然犯傻,颠三倒四
也是这个原因

所以怎么办呢?
其实还是有一定的办法的

从这里开始
就不是按照简单的对话拼接方式
去和大模型沟通

提示词工程,从这个问题开始
就需要引入一些编程手段了

我会在后面的播客里
继续探讨下去

其实今年五月以来
我在处理《王国之泪》游戏速通相关内容的
一些工作里

就尝试开始用大模型去帮助翻译和整理

上面说的这些事情
都是我真实遇到的具体问题

在之前 10 月 28 号的第 11 期播客里
我大致给出了目前大模型实践方面的一些层级

今天我们讲到的,还只是在提示词工程这一层
是第二层

而我个人的一些实践
包括自己集成的一些工具
目前已经用上了第三层的 agent 代理,思维链
现在正在尝试用第四层的多智能体

可以预告的是
明年 TNA 会在这方面拿出比较显著的一些成果
用于加快我们的情报搜集效率
和内容制作速度
以及去打造一些不同的内容形式

但是,什么时候我觉得真的达到了一定的成熟度
这个就很难说了,希望明年开春的时候能有决定性进展

但即使是这样,哪怕我在游戏领域
最终能做到一定程度的多智能体自动组织
我也不觉得 AI 能取代人的作用

AI 可以节约一些重复繁琐的劳动
以及避免犯错误
但是 AI 的知识不足,对新的事物的观察判断的缺乏
始终需要人来补全

人可能会花更少的时间在写稿子
做翻译上

但是,可能要花更多的时间在资料归纳整理
以及社区之间的情报传递上

明年 TNA 可能需要新形态的
给各个不同的游戏建立松散委员会的组织形式
来处理这些信息工作

前几天出了一个笑话
在游戏玩家之间被转发很多

起因是之前有个国内的游戏媒体
打算用 AI 取代游戏编辑来做新闻
然后就把所有的编辑开了

于是,在他们的新闻内容里就出现了
「《漫威蜘蛛侠 2》是《心灵杀手》续作的前作」
这样的话

现在应该已经成了某种梗

这种情况,就是媒体的管理人员
听了别人的忽悠
说 gpt 有多厉害
用这个这个这个模版就能干好多事

其实就是没有意识到大模型在专业性方面的不足
忽悠他们的人
或者他们自己的认知
可能连提示词工程的第二层都没太搞明白
就急着开人了

其实真想把 AI 用好,不仅不能急着开人
反而甚至要引入一些新的开发资源
一些既懂游戏,又懂编程,还正确客观的了解目前这些 AI 概念的人
和原来的编辑一起形成新的技术改造专家团队

这件事才可能一步步地去改进

但符合上述这种条件的人
可能不是随便就能找得来的
找来了,也要花时间磨合

怎么可能急着去开除人呢?

在我看来,非常不理智

我一直认为,AI 的出现,是帮助我们,以更低的成本,把事情做得更好,提升每一件事的质量
而不是以所谓更高的效率,把事情做得更烂,去制造信息垃圾

好的,今天就聊到这里
明天如果没有其他话题
就继续做这方面的科普

祝大家进步,拥有顺利的一天,再见!