Chat GPT 遇上数据库,从数据集获得上下文

2023-03-1608:34:57人工智能与大数据Comments2,704 views字数 2291阅读模式
Chat GPT 遇上数据库,从数据集获得上下文Chat GPT

图 Prompt: AI, Brain, Database,--ar 16:9文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

最近,OpenAI 开放了 ChatGPT-3.5 的 API,并将费用降低了 90%。这个消息一出来,不少开发者大感惊喜。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

我估摸着有不少人对于 ChatGPT 的 API 接口和网页版的 ChatGPT 不太了解,容易混淆。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

需要注意的是,API 接口是为开发者提供的,可以自由使用。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

比如你想让自己的淘宝店接入 ChatGPT,来当作你的智能客服替你回答问题,就需要用到 API 接口,你调用一次 API 接口,就需要消耗一个叫「Token」的东西,0.002 美元 / 每 1000 tokens。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

像一般集成了ChatGPT的一些小工具,都会让你提供 API 接口,你使用这些工具的时候,也会消耗Token,一般一个账户里会有 18 美金的额度,消耗完了就得充值。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

Chat GPT 遇上数据库,从数据集获得上下文

而我们大多数人接触的网页版的 ChatGPT 则是需要在 OpenAI 网站上使用,虽然是免费,但有使用限制。因此,如果你是想进行自然语言处理开发的开发者,或者想将 ChatGPT 接入到某个场景中,使用 ChatGPT-3.5 API 是一个不错的选择。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

网页版的 ChatGPT 也分两个版本,就是免费版跟Premium版本,功能差不多,但Premium响应速度更快,使用的问题也会比较少。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

有个叫「Rowancheung」的老外用普通版跟专业版的 ChatGPT 做了一个对比,默认版本需要 45.06 秒,而专业版只需要 26.55 秒,确实快不少。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

Chat GPT 遇上数据库,从数据集获得上下文

有热度便会有争议,最近开始看到一些观点,说不可过度依赖沉迷于 ChatGPT,会让自己语言组织能力和阅读理解能力越来越低。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

Chat GPT 遇上数据库,从数据集获得上下文

我不敢苟同这种观点,就好比说不要依赖沉迷于交通工具,会导致四肢退化。我也顺便问了问 ChatGPT,它回答的很客气了。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

Chat GPT 遇上数据库,从数据集获得上下文

我个人觉得,主要还是得得看用在什么场景,一些本身不用思考的场景,或者本身知识储备不够无法通过思考的场景,就可以借助 ChatGPT 来完成,比如优化文案,翻译这种事,再比如一些非程序员的用户碰到了程序上的问题,就可以借助它来完成。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

何况人类一直都是借助工具来装备自己的超能力,而 OpenAI 则是超能力的一种,有的人本身语言能力就弱,但逻辑思维能力强,或者想象力丰富,能碰到 ChatGPT 这种工具,就能武装自己把自己的能力发挥出来,从而完成进化。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

可惜这种超能力在当局看来太不可控,它被禁,貌似是一种宿命。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

01
PopClip+ChatGPT
Chat GPT 遇上数据库,从数据集获得上下文
上一期内容聊到的 Bob 插件工具,就集成了这个插件,最近有开发者为 Popclip 开发了一款 Chat GPT 插件,安装插件后,当你选中文本,就可以直接将文本内容发给 ChatGPT,而后在文本下方返回 ChatGPT 的结果,如下图所示。
Chat GPT 遇上数据库,从数据集获得上下文
刚开始用的时候觉得:哇,很方便。但实际用了之后,会觉得有点鸡肋,不如直接在网页端进行对话式输入。另外如果打开一个网页,你选中文本再点击 ChatGPT 的按钮,不会有任何结果,只有在编辑器里有用,不如 PopClip+Bob 的效果好。
但在用的时候我发现了一个使用场景,比如在跟别人聊天对话的时候,你可以直接通过这个方法调用 ChatGPT,比如翻译文本,询问 ChatGPT 一些解决办法,或者优化文案,感觉就是省了一个复制粘贴的步骤。
开发者 @novoreorx 也是觉得有点鸡肋,便在这个基础上进行改进,开发了基于 Popclip 的小插件 ChatGPT Proofreader,这个插件是将比如翻译成中文或者英文这个指令这一步进行包装。
Chat GPT 遇上数据库,从数据集获得上下文
但在使用过程中需要注意,最好是一段文字,不能是一句话,或者这个句子看起来是在询问对方,否则回传的结果不是润色后的文本,而是你跟ChatGPT对话的结果
使用教程:
先去下载 PopClip,而后点击「插件」,第一个 ChatGPT 的插件可以直接安装,具体详情:
https://forum.popclip.app/t/a-popclip-extension-for-chatgpt/1283/2
Chat GPT 遇上数据库,从数据集获得上下文

ChatGPT Proofreader 可见:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

https://reorx.com/makers-daily/003-chatgpt-proofreader-extension-popclip/文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html

里面也聊到了 ChatGPT API 的一些优势,感兴趣的可以看看。
02
Paul Graham GPT
我们在使用Chat GPT的过程,最苦恼的就是它上下文的限制不超过超过 4096 个 token。
先说说现在ChatGPT的两个问题,如果你要去维持会话状态,每次请求时,都需要将之前的历史消息全部发过去,类似于一些邮件格式,如下方这样。
Chat GPT 遇上数据库,从数据集获得上下文
这就会导致是内容会越来越多,费用也会成倍的增加。
开发者 @mckaywrigley 提出了自己的解决方案,他通过构建了一个「Paul Graham GPT」,用于对 Paul Graham 的文章进行搜索和对话,在实现让 ChatGPT 突破上下文的限制,生成自己想要的内容
Chat GPT 遇上数据库,从数据集获得上下文
App:https://paul-graham-gpt.vercel.app/
他将 OpenAI 的 embedding 模型 和 自己的数据库,先在本地搜索数据获得上下文,然后加入本地数据库中的相关内容,这样就可以让 ChatGPT 从自己的数据集获得了上下文,并且给出更相关的理想结果,同时还结合了 ChatGPT 自己庞大的数据集。
网友@dotey对其进行了研究并写了一篇长推可以加深自己对这些原理的理解:
https://twitter-thread.com/t/1631779232455053313
开源库:
https://github.com/mckaywrigley/paul-graham-gpt
文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/31340.html
  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/ai/31340.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定