火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

2023-03-1608:46:55人工智能与大数据Comments3,017 views字数 2799阅读模式

ChatGPT火到出圈,许多人在社交媒体上讨论它,或表达惊讶,或表达忧虑。涛哥和大多数人一样经历了从质疑到惊讶到思考的三个阶段,可以说它突破了我对一个聊天机器人甚至人工智能的理解。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

在突破了我的认知以后,我开始思考它对我以及对所有人的影响可能是什么。首先来了解一下ChatGPT的基本常识。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

ChatGPT是什么?

ChatGPT是一个“认知计算系统”,它的外观表现为一个聊天机器人(如Siri)或者搜索引擎(如百度)。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

聊天机器人这样的产品早在1964年就诞生了,从最早的Eliza到后来的MYCIN专家系统,到最近10年陆续出现的Watson、Siri、小冰等。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

ChatGPT的基本原理是什么?

可以把ChatGPT理解为一个知识加工厂。这个知识加工厂和普通的加工厂一样,都需要原材料、成品、半成品、加工车间、高级工程师(算法工程师)、工人(程序员)、质检员(标注者)。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

原材料:是人类存放在互联网上的知识,例如wiki百科;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

加工车间:是一个“生产流水线”(可以把原材料加工成半成品)运行的场所;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

半成品:是一个知识问题和答案;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

成品:是半成品包装后的各种应用程序,如聊天工具,内容创作工具(AIGC),搜索引擎等。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

算法工程师:相当于加工厂的高级工程师,负责设计加工原材料的方法,包括加工工艺、流程;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

程序员:相当于加工厂的普通工人,负责把加工方法变成可运行的“生产流水线”,以及把半成品组装成成品交付给用户。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

标注者(labler):相当于加工厂的“质检员”,对原材料进行标注处理,并检验半成品有没有质量问题。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

有了这个基本认知,我们再来思考几个基本问题。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

ChatGPT的知识来自哪里?

知识就是知识加工厂的原材料。从内容来源看,尽管官方没有披露具体的信息,但据推测,wiki百科、知识类问答网站可能是其目前内容的主要来源。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

从区域来源看,目前大部分知识(96%)来自英语系国家,其他来自汉语、法语和西班牙语系国家。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

ChatGPT如何判断有没有质量问题?

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

质量问题可能导致加工车间出来的半成品出现瑕疵,造成的结果就是用户通过搜索引擎、聊天工具获取的知识可能是错误的知识。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

ChatGPT对质量的检验主要是在半成品的检验上。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

  1. 首先标注者(Labeler)会从半成品随机进行采样(sample)。每一个样本包含了一个知识问题和加工车间给出的ABCD四个答案。
  2. 然后标注者(labeler)会对4个答案进行打分,分为“优,良,中,差”四个判断标准。
  3. 最后按打分顺序进行排序,如D(优)>C(良)>A(中)>B(差)。

加工车间有一个“机器学习”功能,可以根据标注者的评价自动调整加工过程,从而使所有的半成品都尽可能符合"优"和“良”的标准。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

这个判定标准包含符合人类的三观取向。也就是答复中要去掉暴力、歧视、偏见等不符合大众人生观,价值观,世界观取向的一些答案(将其判定为“差”)。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

有了这样一些认知,接下来我们就可以继续思考大家普遍关注的一些问题。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

能通俗地解释什么是“机器学习”吗?

知识加工工厂的机器学习过程非常像人类小时候学习知识的过程,包含三个阶段。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

1、知识学习在这个阶段,学习的是“什么是什么?”也就是“人是一种动物”,"自行车是两个轮子的交通工具"等一些通过知识三元组表达的问题。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

在这阶段不需要labeler,机器自己就能根据句子中的“主“,"谓”,"宾”结构关系进行学习。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

2、提示学习(prompt learning)文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

在这个阶段,学习的“如果A是B,C也是A,那么B是___”,例如,“人是动物,我是人,那么我是___”。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

这个阶段,加工车间可能会给出错误的答案,如“我是帅哥”,“我是美女”或者“我是王x聪”。这时候需要labeler把四种答案( A帅哥 B 美女 C人类 D王x聪)按优先级进行排序并告诉加工车间最可能的答案顺序如下C->A=B>D。这样,下一次回答问题的时候,机器大概率会回答“我是人类”,而不是“我是帅哥”。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

3、道德学习文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

在这个阶段,加工车间学习的不是知识,而是学会让半成品符合大众的三观。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

例如有个问题是“隔壁家窗户上有一块玻璃,我想___?”。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

加工车间一开始并不知道你的意图,可能会给出四个猜测的答案:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

A.用弹弓打文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

B.用石头砸文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

C.我不知道你想干什么文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

D.取下来装到自己家窗户上。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

这时候labler一定会告诉机器人只有“C”是那个"优"的答案,其他都是“差”的答案。这样加工车间学习了以后下次就会给出符合大家三观的答案。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

需要说明的,实际的场景中,阶段2和3阶段并不是严格区分开的,这里只是为了便于大家理解进行了拆分。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

有了这样一些认知,接下来我们就可以思考一下大家普遍关注的一些问题。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

ChatGPT的知识好像不是最新的知识?

是的。目前ChatGPT里的原材料都是2021年之前生产的,所以无法回答“2022年卡塔尔世界杯冠军是哪个国家?”这样一些问题。说得更简单一点,它还活在2021年。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

ChatGPT的知识好像有错误?

是的,尽管概率很低。ChatGPT有时会给出前后两种矛盾的答案,也就是回答中一部分是对的,一部分又是错的。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

这个问题出在加工工艺上,需要算法工程师优化算法(工艺和流程),难点在于很难掌握平衡,你优化了这个,可能会引起其他问题。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

还有一种错误也可能会出现,就是知识本身的错误,例如谷歌的公司为应对ChatGPT,仓促推出的BARD搜索引擎系统。在回答“詹姆斯・韦伯空间望远镜有哪些发现时?”时,BARD 给出了很多答案,但其中一些照片并不是韦伯拍摄的,而是欧洲南方天文台的超大望远镜(VLT)拍摄的。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

BARD的这个问题出在原材料上,只要更新下原材料就行,但实际上要从海量的原材料里面提前发现这些瑕疵也是很困难的一件事情。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

ChatGPT会有偏见吗?

偏见是三观不正的一种变现形式。ChatGPT在这方面还是做得比较好。目前没有看到更多这方面问题的报道。这也是它能迅速破圈的一个主要原因。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT

但由于ChatGPT的三观实际来自OpenAPI的团队,更确切的说可能来自40多个标注者Labler,它们的三观是否有广泛代表性是个疑问,后续如何进行管理也有很多不确定性。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

我的孩子应该通过它来学习吗?

我不是教育专家,无法回答这个问题。但我已经列举了两个事实:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

1)ChatGPT的知识不是最新的;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

2)ChatGPT会出错,尽管概率很低。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

我仍然建议儿童应该从课堂、从书本、从动手实践中学习知识。ChatGPT的知识来源无法确定,它的三观也需要更长时间和人类进行“对齐”。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

我应该焦虑吗?

人工智能的发展浪潮是不逆转的,它会方方面面重塑我们的生活。人类不应指望技术不发展不进步,而是要思考更好的应用这些技术,把精力投入到更有创造性和更有价值的工作上去。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

与其焦虑,不如思考在人工智能发展的大背景下下,如何让自己的工作更有效率,更有创造性。机器毕竟不是人类,无需过度神话它。它会改变我们的生活,但是否能取代人类,取决我们自身的选择,而不是机器。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html

火到出圈,ChatGPT基本原理是什么?涛哥图解ChatGPT
文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31352.html
  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/ai/31352.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定