AI知识篇
什么是RAG检索增强
0
学习进度0/60
什么是RAG检索增强
让AI拥有实时知识的技术。
大模型很强,但有个致命弱点:它只知道训练时学过的知识。今天公司更新了退款政策,模型不知道;你上传了一份文档,模型也没读过。怎么办?
RAG(Retrieval-Augmented Generation,检索增强生成)= 先从知识库检索相关文档,再把文档作为上下文喂给大模型,让它基于真实资料回答。相当于给 AI 配了一个实时更新的「资料库」。
RAG 技术主要解决了大模型的什么问题?
- 推理速度太慢
- 知识可能过时且容易产生幻觉
- 不支持中文
- 不能生成代码
来对比一下有 RAG 和没有 RAG 的区别,你就明白它有多重要了——
RAG 技术栈:文档加载 → 文本分块 → 向量化(Embedding)→ 存入向量数据库 → 用户提问时检索相似文档 → 拼接成 Prompt 发给 LLM。很多企业级 AI 应用都离不开 RAG。
RAG 让大模型从「通才」变成了「专家」。想让 AI 了解你的公司资料、读懂你的代码库?RAG 就是答案。以后你会经常遇到这个概念。