LightRAG：简单且快速的检索增强生成（RAG）系统，通过结合知识图谱、双层检索机制以及多模态支持

摘要

LightRAG 是一个简单且快速的检索增强生成（RAG）系统，通过结合知识图谱、双层检索机制以及多模态支持，提供高效的文档索引与问答能力。

项目背景：该项目为 EMNLP 2025 论文成果，基于 Python 开发，采用 MIT 开源协议，目前在 GitHub 拥有超 2.8 万 Stars。
系统架构：分为 LightRAG Server（提供 WebUI、API 及兼容 Ollama 的接口）和 LightRAG Core（适用于嵌入式应用或学术研究）。
多模态与扩展性：通过集成 RAG-Anything 支持文本、图像、表格和公式的无缝处理；发布了 VideoRAG（处理超长视频）和 MiniRAG（适配小模型）；消除了处理瓶颈以支持大规模数据集。
存储方案：支持多种存储后端，包括将 MongoDB 或 PostgreSQL 作为统一数据管理方案，以及使用 Neo4J 提供图数据库支持。
模型要求：对 LLM 的实体关系提取能力要求较高，官方建议使用参数量 ≥32B、上下文长度 ≥32KB（推荐 64KB）的模型。
检索增强：支持 Reranker 模型（推荐在混合查询中作为默认模式），并集成了 RAGAS（用于评估）和 Langfuse（用于追踪）。
文档管理：支持文档删除并自动重新生成知识图谱（KG），同时新增了引用功能以实现数据溯源。
部署与依赖：官方强烈推荐使用 uv 进行 Python 包管理以提升性能，并提供了离线/隔离环境的部署指南及 Docker Compose 支持。

初始化风险：在代码中使用 LightRAG Core 时，必须在创建实例后显式调用 await rag.initialize_storages()，否则会导致程序报错。
Embedding 模型绑定限制：必须在文档索引前确定 Embedding 模型，且查询阶段必须使用同一模型。若需更换模型，必须删除现有的向量相关数据表并重新创建。
测试脚本数据冲突：运行官方 Demo 时，若切换了不同的 Embedding 模型，必须手动清理本地数据目录（如 ./dickens），否则程序会发生错误。
索引阶段模型限制：官方明确不建议在文档索引阶段使用推理模型（Reasoning models）。
集成建议：官方不建议直接将 LightRAG Core 集成到常规项目中，而是强烈建议使用 LightRAG Server 提供的 REST API。

[EMNLP2025] “LightRAG: Simple and Fast Retrieval-Augmented Generation”