ChatGPT工作原理:什么是模型?

2023-05-2219:47:48人工智能与大数据Comments604 views字数 712阅读模式

假设你想知道(就像伽利略在 15 世纪末所做的那样),从比萨塔的每一层落下的炮弹要多长时间才能落地。那么,你可以在每一种情况下测量它,并将结果制成表格。或者你可以做理论科学的精髓:建立一个模型,给出某种计算答案的程序,而不是仅仅测量和记住每个案例。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

让我们想象一下,我们有(有点理想化的)数据,说明炮弹从不同楼层落下需要多长时间。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

ChatGPT工作原理:什么是模型?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

我们如何计算出它从一个我们没有明确数据的楼层落下需要多长时间?在这种特殊情况下,我们可以用已知的物理学定律来计算。但是,如果说我们所得到的只是数据,而我们不知道有什么基本定律在支配它。那么我们可以做一个数学上的猜测,比如说,也许我们应该用一条直线作为模型。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

ChatGPT工作原理:什么是模型?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

我们可以选择不同的直线。但这是平均来说最接近我们所给的数据的一条。而根据这条直线,我们可以估算出任何楼层的下降时间。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

我们怎么知道要在这里尝试使用一条直线呢?在某种程度上我们不知道。这只是数学上简单的东西,而我们已经习惯了这样的事实:我们测量的很多数据都被数学上简单的东西很好地拟合了。我们可以尝试一些数学上更复杂的东西 —— 比如说 a + bx + cx2,然后在这种情况下,我们做得更好:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

ChatGPT工作原理:什么是模型?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

不过,事情可能会出大问题。比如这里是我们用 a + b/c + x sin(x) 最多也就做成:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

ChatGPT工作原理:什么是模型?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

值得理解的是,从来没有一个 “无模型的模型”。你使用的任何模型都有一些特定的基础结构,然后有一组 “你可以转动的旋钮”(即你可以设置的参数)来适应你的数据。而在 ChatGPT 的案例中,使用了很多这样的 “旋钮” —— 实际上,有 1750 亿个。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

但令人瞩目的是,ChatGPT 的底层结构 —— “仅仅” 有这么多的参数 —— 足以使一个计算下一个单词概率的模型 “足够好”,从而为我们提供合理的文章长度的文本。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/41481.html

  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/ai/41481.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定