Chat GPT 遇上数据库，从数据集获得上下文

2023-3-16

Chat GPT

图 Prompt: AI, Brain, Database,--ar 16:9

最近，OpenAI 开放了 ChatGPT-3.5 的 API，并将费用降低了 90%。这个消息一出来，不少开发者大感惊喜。

我估摸着有不少人对于 ChatGPT 的 API 接口和网页版的 ChatGPT 不太了解，容易混淆。

需要注意的是，API 接口是为开发者提供的，可以自由使用。

比如你想让自己的淘宝店接入 ChatGPT，来当作你的智能客服替你回答问题，就需要用到 API 接口，你调用一次 API 接口，就需要消耗一个叫「Token」的东西，0.002 美元 / 每 1000 tokens。

像一般集成了ChatGPT的一些小工具，都会让你提供 API 接口，你使用这些工具的时候，也会消耗Token，一般一个账户里会有 18 美金的额度，消耗完了就得充值。

而我们大多数人接触的网页版的 ChatGPT 则是需要在 OpenAI 网站上使用，虽然是免费，但有使用限制。因此，如果你是想进行自然语言处理开发的开发者，或者想将 ChatGPT 接入到某个场景中，使用 ChatGPT-3.5 API 是一个不错的选择。

网页版的 ChatGPT 也分两个版本，就是免费版跟Premium版本，功能差不多，但Premium响应速度更快，使用的问题也会比较少。

有个叫「Rowancheung」的老外用普通版跟专业版的 ChatGPT 做了一个对比，默认版本需要 45.06 秒，而专业版只需要 26.55 秒，确实快不少。

有热度便会有争议，最近开始看到一些观点，说不可过度依赖沉迷于 ChatGPT，会让自己语言组织能力和阅读理解能力越来越低。

我不敢苟同这种观点，就好比说不要依赖沉迷于交通工具，会导致四肢退化。我也顺便问了问 ChatGPT，它回答的很客气了。

我个人觉得，主要还是得得看用在什么场景，一些本身不用思考的场景，或者本身知识储备不够无法通过思考的场景，就可以借助 ChatGPT 来完成，比如优化文案，翻译这种事，再比如一些非程序员的用户碰到了程序上的问题，就可以借助它来完成。

何况人类一直都是借助工具来装备自己的超能力，而 OpenAI 则是超能力的一种，有的人本身语言能力就弱，但逻辑思维能力强，或者想象力丰富，能碰到 ChatGPT 这种工具，就能武装自己把自己的能力发挥出来，从而完成进化。

可惜这种超能力在当局看来太不可控，它被禁，貌似是一种宿命。

PopClip+ChatGPT

上一期内容聊到的 Bob 插件工具，就集成了这个插件，最近有开发者为 Popclip 开发了一款 Chat GPT 插件，安装插件后，当你选中文本，就可以直接将文本内容发给 ChatGPT，而后在文本下方返回 ChatGPT 的结果，如下图所示。

刚开始用的时候觉得：哇，很方便。但实际用了之后，会觉得有点鸡肋，不如直接在网页端进行对话式输入。另外如果打开一个网页，你选中文本再点击 ChatGPT 的按钮，不会有任何结果，只有在编辑器里有用，不如 PopClip+Bob 的效果好。

但在用的时候我发现了一个使用场景，比如在跟别人聊天对话的时候，你可以直接通过这个方法调用 ChatGPT，比如翻译文本，询问 ChatGPT 一些解决办法，或者优化文案，感觉就是省了一个复制粘贴的步骤。

开发者 @novoreorx 也是觉得有点鸡肋，便在这个基础上进行改进，开发了基于 Popclip 的小插件 ChatGPT Proofreader，这个插件是将比如翻译成中文或者英文这个指令这一步进行包装。

但在使用过程中需要注意，最好是一段文字，不能是一句话，或者这个句子看起来是在询问对方，否则回传的结果不是润色后的文本，而是你跟ChatGPT对话的结果

使用教程：

先去下载 PopClip，而后点击「插件」，第一个 ChatGPT 的插件可以直接安装，具体详情：

https://forum.popclip.app/t/a-popclip-extension-for-chatgpt/1283/2

ChatGPT Proofreader 可见：

https://reorx.com/makers-daily/003-chatgpt-proofreader-extension-popclip/

里面也聊到了 ChatGPT API 的一些优势，感兴趣的可以看看。

Paul Graham GPT

我们在使用Chat GPT的过程，最苦恼的就是它上下文的限制不超过超过 4096 个 token。

先说说现在ChatGPT的两个问题，如果你要去维持会话状态，每次请求时，都需要将之前的历史消息全部发过去，类似于一些邮件格式，如下方这样。

这就会导致是内容会越来越多，费用也会成倍的增加。

开发者 @mckaywrigley 提出了自己的解决方案，他通过构建了一个「Paul Graham GPT」，用于对 Paul Graham 的文章进行搜索和对话，在实现让 ChatGPT 突破上下文的限制，生成自己想要的内容

App：https://paul-graham-gpt.vercel.app/

他将 OpenAI 的 embedding 模型和自己的数据库，先在本地搜索数据获得上下文，然后加入本地数据库中的相关内容，这样就可以让 ChatGPT 从自己的数据集获得了上下文，并且给出更相关的理想结果，同时还结合了 ChatGPT 自己庞大的数据集。

网友@dotey对其进行了研究并写了一篇长推可以加深自己对这些原理的理解：

开源库：

THE END