wsl-docs

❯

❯

RAG

2026年3月11日2分钟阅读

定义

RAG（Retrieval-Augmented Generation）是先检索外部知识，再由模型生成回答的应用模式。

核心内涵

RAG 技术通过将大语言模型的参数化记忆与外部数据库的非参数化记忆相结合，有效缓解了模型幻觉问题，并突破了模型训练数据的时效性限制。它使得 AI 系统能够基于企业私有数据或最新公开信息进行精准推理，是构建高可靠性知识问答与智能体系统的关键架构。

实践要点

检索质量决定生成上限，需重点优化文档切分策略、向量化模型选择及混合检索算法。
建立动态更新的上下文数据库，确保底层知识源的准确性与时效性。
在提示词中明确要求模型仅基于检索到的上下文进行回答，以最大化控制生成风险。
引入重排机制与上下文压缩技术，在有限的上下文窗口内提供最高价值的信息密度。

相关词条

context-database
knowledge-graph
data-pipeline
workflow

关联主题

AI
llm
Agent
llmops
evals
context-database
memory
data-pipeline
knowledge-graph
context-optimization
prompt

关系图谱

定义
核心内涵
实践要点
相关词条
关联主题

反向链接

ETL
context-database
context-optimization
data-pipeline
knowledge-graph
llm
llmops
memory
关系图谱
知识图谱
Claude Capabilities Notebook 实战补充
Claude Capabilities 指南与 Promptfoo 评测实践
Claude Cookbooks 项目总览与能力地图
Claude 第三方集成 Cookbook 检索与知识工具
Claude 第三方集成 Cookbook 语音与多模态应用
Contextual Retrieval：上下文检索方法
Deepgram 与 LlamaIndex 集成入口
Voyage AI Embeddings 接入与检索实践
面向 AI Agent 的上下文工程实践
RAG 架构设计
RTEB：检索评测新标准
Clawdbot 如何记住一切：本地持久记忆系统解析
Mistral AI 平台服务 La Plateforme 开启抢先体验
使用 LLM 作为 RAG 评审器
Nemotron Labs：AI 智能体如何将文档转化为实时的商业智能
GPT-5.1 如何助力 Tolan 构建语音交互 AI
TRUSTBANK 利用 AI 智能体打造个性化“故乡纳税”礼品推荐
走进 OpenAI 的自研数据智能体
为什么大语言模型会产生幻觉？
从零开始构建 LangGraph 智能体
在SQL表中构建高性价比的Agentic RAG系统处理长文本
AI Memory 与 Memo：高质量仓库与博客产品清单
AI Memory：高质量仓库与博客产品清单
2023 年，我患上了 AI 焦虑症
AI编程革命：代码的未来，由AI重塑！
Anthropic 在和客户合作的过程中总结的的企业落地 AI 最佳实践以及常见错误
Booking.com 在 AI 落地方面的探索
Jeff Dean 深度访谈：一页纸备忘录促成 Gemini 的诞生，Google AI 的反击与 10,000 Token 的未来
LinkedIn 团队构建生成式 AI 产品的经验教训
xAI 全员大会实录：递归自我改进、5000 万视频/天、月球上的质量驱动器
“2025年 AI coding 将如何演进”播客文稿
一些“小模型”的使用案例
一文看懂“提示词” vs “提示词工程” vs “上下文工程”
基于大语言模型的 Vibe Coding 综述
大厂与其山寨 Cursor，不如做个好用的 AI 邮件客户端
如何可以向 ChatGPT 输入大量文本内容并提问？
如何能用 AI 撰写一份专业的“某地区域经济报告”？
如果我把一个主播平时回答过的问题都交给 AI 训练，是不是以后问 AI 就可以和问主播一样的效果了？
现阶段 AI 的价值和盈利方向？
生成式 AI 路由
退一步提示法解读
问答：在 RAG 应用中，GPT-3.5 足够就足够了吗？
问答：知识库和微调的差别
问：要开设一门AI通识课，但需要全程在机房上课无法平衡理论和上机操作
马斯克号称 Grok 3 的知识库是实时更新的，别被他忽悠了！
Agent 架构综述：从 Prompt 到 Context
Vercel 给 Agent Skills 泼了一盆冷水
对话 Elys 创始人：他的 10 个产品洞察，和他想创造的下一代社交网络
ICLR 2026：LightRetriever 将 Embedding 计算从 Query 侧移除
AnythingLLM：桌面与 Docker 一体化 LLM 应用
Crawl4AI：LLM 友好的网页抓取与 Markdown 提取引擎
DB-GPT：开发框架
Dify：开源工具链用于 LLM 应用与 agent 工作流开发
FastGPT：a knowledge-based platform built on the LLMs
Firecrawl：LLM 网页抓取与提取 API 工具
Google ADK：Agent 开发工具包与多语言部署支持
Graphiti：面向智能体的知识图谱记忆层
HuLa：基于 Tauri 与 Vue 3 的跨平台即时通讯系统
JeecgBoot：应用平台
Khoj：开源 AI 助手与知识检索工具
Kiln：AI 系统构建、评估与优化平台
LangChain：LLM 应用开发组件库与 Agent 编排工具
Langchain-Chatchat：开源、可离线部署的 RAG 与 Agent 应用项目
Langflow：AI agent 与工作流可视化构建工具
Mastra：工具链用于 AI 应用与智能体工程
NarratoAI：一站式 AI 影视解说与自动化剪辑工具
OpenViking：面向 AI Agent 的上下文数据库
Pathway：Git 项目实时流处理与 LLM 数据管道
Perplexica：an AI-powered answering engine
RAGFlow：结合 Agent 能力的开源 RAG 引擎
RuoYi AI：全栈 AI 应用开发平台
RuoYi-AI：全栈 AI 应用开发平台
Second-Me：AI 分身训练与记忆系统
Sim：智能体工作流编排工具与可视化构建
agenticSeek：开源深度研究与检索智能体
airweave：面向 AI 智能体的开源上下文检索层项目
baml：面向 AI 工作流与智能体的提示词编程语言项目
cocoindex：Data transformation framework框架
deep-searcher：Open Source Deep Research Alternative to Reason and Search on Private Data
gpt_academic：专为科研与学术优化的 LLM 交互接口项目
graphrag：A modular graph-based Retrieval-Augmented Generation (RAG) system
langchain4j：Java 生态的大语言模型集成框架
livekit：开源实时音视频与数据通信栈项目
llm-app：Pathway 的实时 RAG 与 AI 流水线模板库
llmware：Unified framework for building enterprise RAG pipelines with small
memvid：Memory layer for AI Agents, Replace complex RAG pipelines with a serverless
onyx：开源 AI 聊天与大模型平台
pandas-ai：Chat with your database or your datalake (SQL
paperless-ai：Paperless-ngx 的 AI 增强扩展项目
scira：Scira (Formerly MiniPerplx) is a minimalistic AI-powered search engine that
EverMind-AI-EverMemOS：AI 记忆与检索基础设施
Growth-Kinetics-DiffMem：AI 记忆与检索基础设施
MemMachine-MemMachine：AI 记忆与检索基础设施
OSU-NLP-Group-HippoRAG：AI 记忆与检索基础设施
Open WebUI：自托管 AI 系统与多模型 RAG 集成中枢
RAG-Anything：RAG-Anything: All-in-One RAG Framework”
RichmondAlake-memorizz：AI 记忆与检索基础设施
StarlightSearch-EmbedAnything：AI 记忆与检索基础设施
agentset-ai-agentset：AI 记忆与检索基础设施
christopherkarani-Wax：AI 记忆与检索基础设施
chroma：Open-source search and retrieval database for AI applications
deepset-ai-haystack：AI 记忆与检索基础设施
docling：Get your documents ready for gen AI
mem0ai-mem0：AI 记忆与检索基础设施
memvid-memvid：AI 记忆与检索基础设施
milvus：高性能云原生向量数据库
moyangzhan-langchain4j-aideepin：AI 记忆与检索基础设施
neuron-core-neuron-ai：AI 记忆与检索基础设施
philippgille-chromem-go：AI 记忆与检索基础设施
qhjqhj00-MemoRAG：AI 记忆与检索基础设施
storm：基于大语言模型（LLM）的知识管理与生成系统，能够通过互联网检索自动研究主题并生成带有引用的维基百科风格长篇报告
supermemoryai-supermemory：AI 记忆与检索基础设施
topoteretes-cognee：AI 记忆与检索基础设施
vectorize-io-hindsight：AI 记忆与检索基础设施
vllm-project-vllm：AI 记忆与检索基础设施
volcengine-OpenViking：AI 记忆与检索基础设施
Archon：为 AI 编程助手（如 Cursor、Claude Code 等）提供知识库和任务管理骨干支持的控制中心，通过作为模型上下文协议（MCP）服务器运行
Coze Studio：开源可视化 AI Agent 开发工具，支持工作流、RAG 与插件
GenAI_Agents：备受欢迎的开源项目，提供了从基础到高级的生成式 AI Agent（智能体）全面构建教程与丰富的实用代码实现
GreatScottyMac-context-portal：AI 编程助手与Agent工具
LightRAG：简单且快速的检索增强生成（RAG）系统，通过结合知识图谱、双层检索机制以及多模态支持
Qwen-Agent：Agent framework and applications built upon Qwen＞=3
Tabby：GitHub Copilot 本地替代的开源自托管 AI 编程助手
aichat：命令行工具
claude-flow：The leading agent orchestration platform for Claude
deepwiki-open：代码仓库自动分析与交互式 Wiki 生成工具
eliza：开源多智能体 AI 开发工具，支持模块化架构与插件扩展
llama_index：LlamaIndex is the leading document agent and OCR platform
local-deep-research：Local Deep Research achi Agent 工具
open-notebook：开源、注重隐私的 Google Notebook LM 替代方案，支持完全本地化部署、接入 16+ 种 AI 模型
opik：开源 AI 观测评估工具，用于追踪与监控 LLM 应用、RAG 系统及 Agent 工作流
szczyglis-dev-py-gpt：AI 编程助手与Agent工具
vanna：SQL 数据库对话分析工具
AI Engineering Hub：AI 工程实践与资源合集
Awesome DeepSeek Integration：DeepSeek API 集成生态清单
Awesome LLM Apps：AI agent 与 RAG 实战项目精选库
Foundations-of-LLMs：高热度的开源学习资源项目（超1.5万Stars），提供了一本系统讲解大语言模型基础知识与前沿技术的开源教材《大模型基础》及配套论文列表
Generative AI for Beginners：微软 21 课生成式 AI 入门课程
Hugging Face Agents Course：智能体开发课程
LLMForEverybody：大模型学习与面试知识库
Prompt-Engineering-Guide：极具人气且全面的开源知识库，专注于提供提示工程（Prompt Engineering）、RAG 和 AI 代理相关的指南、论文、课程及工具资源
agents-towards-production：开源的实战指南，提供端到端、代码优先的 Jupyter Notebook 教程
aie-book：WIP] Resources for AI engineers
awesome-generative-ai-guide：极受欢迎的生成式 AI 综合资源库，汇集了前沿研究论文、面试指南、学习路线图以及超过 90 门免费课程
easy-dataset：专为大语言模型（LLM）微调、RAG 和性能评估设计的强大开源工具，能够将多种格式的非结构化文档转化为高质量的结构化数据集
happy-llm：大语言模型学习与实践教程
llm-cookbook：Datawhale 开源的面向开发者的 LLM 入门教程，基于吴恩达大模型系列课程进行中文翻译与本地化代码复现
ninehills/blog 技术 issue 提及文档索引
self-llm：专为国内初学者打造的开源大模型教程，提供基于 Linux 环境的模型部署、应用集成与高效微调的全流程指导
Conductor：面向微服务与 AI Agent 的事件驱动工作流编排引擎
Hands-On-Large-Language-Models：O'Reilly 出版的《Hands-On Large Language Models》一书的官方配套代码仓库
MarkItDown：多格式内容转 Markdown 的 Python 工具
RAG_Techniques：备受欢迎的开源项目，通过一系列 Jupyter Notebook 教程展示了多种高级检索增强生成（RAG）技术
RagaAI-Catalyst：Agent AI 可观测性监控与评估 Python SDK
SurfSense：Connect any LLM to your internal knowledge sources and chat with it in real

Created with Quartz v4.5.2 © 2026

GitHub