思考 | 如果大模型都像 kimi 有200w字上下文，RAG还有意义吗？

2024-03-24 15:59#1 标记1

今天使用kimi时，发现我依然还在 kimi 的200w字上下文排队申请中。这次的kimi chat 出圈儿实在是太火爆了，连官方都紧急扩容5次给用户使用了。

就在准备工作时，突然想到了一个问题，也是今天公众号文章的题目。
如果大模型都像 kimi 有200w字上下文，RAG还有意义吗？
一、什么是RAG？
简单来说，就是分三部分，从知识库检索信息，然后把信息作为prompt的一部分一同喂给大模型，相当于让大模型开卷考试，从比较准确的信息中给出回答。
检索（Retrieve）：从外部知识源检索相关信息。
增强（Augment）：将检索到的信息与用户查询结合。
生成（Generate）：利用结合的信息生成回答。
二、RAG解决了什么问题？
其实呢，RAG最主要是为了解决大模型两个问题：
大模型幻觉问题，
2.大模型本身知识库不全/不新。
因此，采用RAG，就相当于给大模型外挂一个可以经常更新的知识库，提高了大模型回答的准确性。
三、200w字上下文，有什么用？
而200w字的上下文，有没有解决大模型的问题呢？
在我看来，有点类似于“曲线救国”，只是把问题解决了一半。
为啥呢？
有了超长上下文，确实可以把整个知识库作为一个文件，比如txt文件喂给大模型，让大模型从中找到相关信息。
这也算是 few-shot，和RAG有异曲同工之妙。都是通过向量相似度匹配，只不过一个是大模型自己做的（kimi就可以这么理解），一个是在外部做好向量检索返回的结果再喂给大模型（RAG）
但是呢，幻觉问题也没解决，换言之也就是无损压缩问题没解决。
四、结论
其实我觉得，200w字上下文也是一个巨大的进步，和RAG应该是相辅相成的。
毕竟RAG的缺点是占用了prompt一定程度的 token 数量。
有了超长上下文支持，也不在乎这一点占用量了不是嘛。
毕竟，小学生才做选择，超长上下文和RAG我都要~
送上一句月之暗面CEO杨植麟采访名句： “所有问题都是文本长度的问题。如果你有10亿的 context length（上下文长度），今天看到的问题都不是问题”。
最后，如果你感兴趣的话，千万记得要加我 aiaiai2098，发送暗号：“芝麻开门”，我会拉你进 AI-RPA 群，一起交流。
另外，一群已经人满啦，现在是交流二群哦。
往期文章：
必看！RPA 自动化开发效率增加100%
RPA写的小红书AI Agnet，终于搞定了（文末自取）
我写了一款可以自动刷GPTs对话的机器人