RAG是什么？用大白话讲清楚

王尘宇 AI百科 2026-06-11 08:11:36 2

2026年AI圈提到最多的词除了Agent就是RAG了。很多技术文章把它写得很玄乎，其实概念很简单。

RAG就是"翻书再回答"

假设你问大模型一个问题："我们公司今年的销售额是多少？"大模型是不知道的——它的训练数据里没有你公司的信息。RAG做的事就是：你问问题 → 系统先去你的知识库/文档里搜相关内容 → 把搜到的内容连同你的问题一起发给大模型 → 大模型基于这些"参考资料"来回答。相当于让AI先翻了相关资料再开口，而不是凭空编。

为什么需要RAG

两个原因。一是大模型的知识有截止日期，训练之后发生的事情它不知道。二是大模型会"幻觉"——不确定的事也装得很确定地说出来。RAG给了它参考资料，幻觉率明显下降。

一个实际例子

我们公司内部做了一个RAG系统：把所有产品文档、客户FAQ、技术手册喂进去。客服接到用户问题时，RAG系统先检索相关文档段落，再让AI基于这些段落回答。准确率从纯靠AI回答的70%提到了90%以上。

跟微调有什么区别

微调是"教AI学会新知识"——要训练、要GPU、费时间。RAG是"给AI一本参考书"——不需要训练，更新知识库就行。两者的区别就像让一个人重新上学（微调）和给他一本手册让他查（RAG）。

做RAG需要什么

一个向量数据库（存文档）、一个embedding模型（把文本转成向量）、一个大模型（生成答案）。开源方案里LangChain加ChromaDB加本地模型就能跑起来。

标签： RAG 检索增强生成 AI技术大模型向量数据库

本文地址： http://wangchenyu.com/aibaike/155462.html

文章来源：王尘宇

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

发布评论（0条评论）

还木有评论哦，快来抢沙发吧~