bilibili.com/video/BV1uM411D7Bq

下午好，这里是蓝色蒜头短播客
2023 年 11 月 9 号，第 21 期

今天有一些设备故障
录播客耽误了一会
明天还是要恢复到早上发布

这个星期一 openai 开了一次发布会
公布了不少新功能和模型的升级
然后从昨天开始，因为使用人数忽然变多
服务也是开始不正常

昨天停机了一个多小时
现在我录播客的这会儿好像又出了问题

在等他服务恢复的这段时间
今天继续来聊聊 openai 和 chatgpt 的相关话题

虽然这半年多以来
很多媒体也在聊
这些媒体有时不太理性
要么过于乐观，觉得技术革命推动世界改变就在明天
要么过于悲观，说泡沫成分很大，可能要像区块链元宇宙一样崩盘

他们说的其实都有一定道理
但各自为了证明立场，多少有夸大成分

我在短播客里讲的内容
有缘听到的朋友
也可以当成一个补充角度

其实任何技术变革的到来
都不会是平地惊雷
而是春雨润物细无声
然后不知什么时候就一夜新发嫩芽

我想，等短播客做到 200 期 300 期的时候
可能很多现象就会显得更不一样了
我们不妨到那个时候再来回顾

短播客每一期说不了很深
所以分散着泛泛而谈，一次说一个小点
也当做我自己的一种小总结

目前看来，各个公司正在做的大语言模型
随着算力和输入数据的提升
大家最终看来基本会趋于类似

所以参考 chatgpt 与 openai 总结的一些观念
应该也是适用于所有同类模型

首先，chatgpt 的核心并不是聊天
虽然它叫 chat 但是如果按照一个聊天机器人去理解的话
就会有很大的理解偏差

很多朋友会觉得它「不过如此」
也是因为一直在按照这种角度去理解

人和人聊天的时候，信息是散碎的以及模糊的
通常不会说非常长的话
考虑到对话的环境
以及对话的人
一些你懂我也懂的概念
就不用说的那么细
有时候会体现为一些特定术语

比如我说，王泪发售大概两周左右
glitch-hunting 社区就发现了比较稳定的无伞 FDC

这句话里，王泪说的是塞尔达传说王国之泪
如果不了解王国之泪游戏速通的话
甚至不了解游戏速通的话
这里面说的 glitch-hunting
还有「无伞」还有「FDC」

可能都不知道是什么意思

人会不知道，所以 chatgpt 这样的 ai 模型
经常也会不知道
虽然它输入了很多很多的训练数据

但人类的知识信息确实浩如烟海
哪怕一个很大的团队
每天往里无脑的拷贝信息
也不可能在很短的几年时间里覆盖太多的领域

况且并不可能无脑的往里拷贝
数据训练还是一个相对复杂的过程
需要对原始内容进行反复的确认、清洗、标记

这些工作，看内容类型
有的需要比较专业的领域知识
有的内容，比如娱乐新闻的内容整理
对人的要求可能就比较低

openai 为了做这件事情
在非洲、南美一些经济较差的国家
通过网络外包，把任务根据知识要求，分成不同的等级
让很多人在网上完成信息整理标注

其他的公司，如果要用类似的技术手段去实现大模型
那么基本也是要做类似的事情
说白了，很多的 GPU 算力，加上很多的人工
消耗时间，这件事情就能完成

这也是为什么说随着时间推移
可能各个公司的大模型逐渐会趋于一致
现在所有这个领域的投资
大头都用在拼算力拼人工
哪个公司撑不住了，可能就要先行退场

非常像是那种最后变成拼资金量的
澳门或拉斯维加斯的残酷赌局

在这个时候
一些大公司会选择裁掉很多比较贵的人
然后投入更多的资金到上面的这些事情上
也确实是在赌明天了

说的有点远
回到大模型本身上
现在的任何大模型，包括目前最好的前天才发布的
GPT4-turbo

懂得确实已经很多了
但是还不够多，具体到特别小的领域
他并不理解你的特定用语

所以，如果只是泛泛的聊天
他能和你聊的很不错
但如果是上面说的这些特定用语
他就没法跟你聊了，或者会有一些牛头不对马嘴的回复

很多负面意见基本就是从这里来的
尝试和 chatgpt 聊一些比较专业的内容
效果非常不理想

于是肯定很容易有一个结论
觉得这东西就是个玩具
吹牛吹的都上天了

只按聊天去理解
就很容易在直觉上有这种结论

其实只要点破一个点
这类模型就会一下子变得更有用

就是忘掉日常聊天
还是先不要把它当成一个人去对待
而是用稍微机械化一点的思维去沟通

举个简单的例子
我给他一篇比较长的新闻

如果只是把新闻贴过去
然后说，把新闻要素和事件脉络整理出来

其实结果经常是不太好的
甚至每次反馈的结果格式都不一样

有一些比较严谨的人
这时候就会开始觉得 chatgpt 很傻，很吹牛
做不了一点专业的事情

其实不是
这里有一个很简单也很死板的策略
你想要什么格式，就原原本本的告诉他

比如说，请你从新闻里提取
其中说到的每个事件的
时间、地点、人物、事件描述、相关公司或团体
整理成表格，每列是一个要素
每行是一个事件

这时候，它输出的结果在 90% 的情况下
就会是比较一致的规范的

差别就是，每次都把这些很啰嗦的具体描述给他
这里就是为什么说，不能按聊天去理解

因为和人聊天的时候
没有这么聊的
如果正常聊天的时候，每次都像这样把具体要求说一遍
要么是提要求的人脑子有问题
要么是接收要求的人脑子有问题

大模型目前还远远不是人
暂时没有脑子
所以很多时候必须要这样和他对话

一旦认识到这一点
用更呆板的方式，更不聪明的方式去用它
它反而会在一些具体问题上变得更厉害一些

其实对于很多经常关注大模型的朋友来说
这也是特别常识的一个概念了

这种不按正常说话的方式
忘掉一般的聊天
每次都把具体的要求反复说一遍
这种做法，就叫做提示词工程 prompts engineering

了解了这个概念
忘掉一般的聊天
就构成了对现在的大语言模型如何正确使用的一个基本理解

所有更复杂的，更厉害的
很多媒体会说的云里雾里、讳莫如深的事情
其实都是从这个基础开始

那前面说到的
王泪发售大概两周左右
glitch-hunting 社区就发现了比较稳定的无伞 FDC

这句话里的这些术语
怎么样让他有比较正确的理解

其实也可以通过提示词工程做到
但今天来不及了
这个我们在后面的短播客里再继续说

说起来，我也考虑了很久
是不是要把这些概念知识
做成从零开始的，谁都看得明白的
有点教程性质的视频

看了一圈很多人已经做过了
但是讲得要么还是太神秘兮兮
要么计算机术语太多不够直白
要么营销味道太重

该不该做呢，比较矛盾
再想想吧

好，今天先聊到这里
祝大家进步，拥有顺利的下午和夜晚，再见！

DAY-21 有的人觉得 ChatGPT 很傻，有的人又觉得很厉害