Chat GPT 遇上数据库,从数据集获得上下文

Chat GPT

图 Prompt: AI, Brain, Database,--ar 16:9

最近,OpenAI 开放了 ChatGPT-3.5 的 API,并将费用降低了 90%。这个消息一出来,不少开发者大感惊喜。

我估摸着有不少人对于 ChatGPT 的 API 接口和网页版的 ChatGPT 不太了解,容易混淆。

需要注意的是,API 接口是为开发者提供的,可以自由使用。

比如你想让自己的淘宝店接入 ChatGPT,来当作你的智能客服替你回答问题,就需要用到 API 接口,你调用一次 API 接口,就需要消耗一个叫「Token」的东西,0.002 美元 / 每 1000 tokens。

像一般集成了ChatGPT的一些小工具,都会让你提供 API 接口,你使用这些工具的时候,也会消耗Token,一般一个账户里会有 18 美金的额度,消耗完了就得充值。

而我们大多数人接触的网页版的 ChatGPT 则是需要在 OpenAI 网站上使用,虽然是免费,但有使用限制。因此,如果你是想进行自然语言处理开发的开发者,或者想将 ChatGPT 接入到某个场景中,使用 ChatGPT-3.5 API 是一个不错的选择。

网页版的 ChatGPT 也分两个版本,就是免费版跟Premium版本,功能差不多,但Premium响应速度更快,使用的问题也会比较少。

有个叫「Rowancheung」的老外用普通版跟专业版的 ChatGPT 做了一个对比,默认版本需要 45.06 秒,而专业版只需要 26.55 秒,确实快不少。

有热度便会有争议,最近开始看到一些观点,说不可过度依赖沉迷于 ChatGPT,会让自己语言组织能力和阅读理解能力越来越低。

我不敢苟同这种观点,就好比说不要依赖沉迷于交通工具,会导致四肢退化。我也顺便问了问 ChatGPT,它回答的很客气了。

我个人觉得,主要还是得得看用在什么场景,一些本身不用思考的场景,或者本身知识储备不够无法通过思考的场景,就可以借助 ChatGPT 来完成,比如优化文案,翻译这种事,再比如一些非程序员的用户碰到了程序上的问题,就可以借助它来完成。

何况人类一直都是借助工具来装备自己的超能力,而 OpenAI 则是超能力的一种,有的人本身语言能力就弱,但逻辑思维能力强,或者想象力丰富,能碰到 ChatGPT 这种工具,就能武装自己把自己的能力发挥出来,从而完成进化。

可惜这种超能力在当局看来太不可控,它被禁,貌似是一种宿命。

01
PopClip+ChatGPT
上一期内容聊到的 Bob 插件工具,就集成了这个插件,最近有开发者为 Popclip 开发了一款 Chat GPT 插件,安装插件后,当你选中文本,就可以直接将文本内容发给 ChatGPT,而后在文本下方返回 ChatGPT 的结果,如下图所示。
刚开始用的时候觉得:哇,很方便。但实际用了之后,会觉得有点鸡肋,不如直接在网页端进行对话式输入。另外如果打开一个网页,你选中文本再点击 ChatGPT 的按钮,不会有任何结果,只有在编辑器里有用,不如 PopClip+Bob 的效果好。
但在用的时候我发现了一个使用场景,比如在跟别人聊天对话的时候,你可以直接通过这个方法调用 ChatGPT,比如翻译文本,询问 ChatGPT 一些解决办法,或者优化文案,感觉就是省了一个复制粘贴的步骤。
开发者 @novoreorx 也是觉得有点鸡肋,便在这个基础上进行改进,开发了基于 Popclip 的小插件 ChatGPT Proofreader,这个插件是将比如翻译成中文或者英文这个指令这一步进行包装。
但在使用过程中需要注意,最好是一段文字,不能是一句话,或者这个句子看起来是在询问对方,否则回传的结果不是润色后的文本,而是你跟ChatGPT对话的结果
使用教程:
先去下载 PopClip,而后点击「插件」,第一个 ChatGPT 的插件可以直接安装,具体详情:
https://forum.popclip.app/t/a-popclip-extension-for-chatgpt/1283/2

ChatGPT Proofreader 可见:

https://reorx.com/makers-daily/003-chatgpt-proofreader-extension-popclip/

里面也聊到了 ChatGPT API 的一些优势,感兴趣的可以看看。
02
Paul Graham GPT
我们在使用Chat GPT的过程,最苦恼的就是它上下文的限制不超过超过 4096 个 token。
先说说现在ChatGPT的两个问题,如果你要去维持会话状态,每次请求时,都需要将之前的历史消息全部发过去,类似于一些邮件格式,如下方这样。
这就会导致是内容会越来越多,费用也会成倍的增加。
开发者 @mckaywrigley 提出了自己的解决方案,他通过构建了一个「Paul Graham GPT」,用于对 Paul Graham 的文章进行搜索和对话,在实现让 ChatGPT 突破上下文的限制,生成自己想要的内容
App:https://paul-graham-gpt.vercel.app/
他将 OpenAI 的 embedding 模型 和 自己的数据库,先在本地搜索数据获得上下文,然后加入本地数据库中的相关内容,这样就可以让 ChatGPT 从自己的数据集获得了上下文,并且给出更相关的理想结果,同时还结合了 ChatGPT 自己庞大的数据集。
网友@dotey对其进行了研究并写了一篇长推可以加深自己对这些原理的理解:
https://twitter-thread.com/t/1631779232455053313
开源库:
https://github.com/mckaywrigley/paul-graham-gpt
THE END