摘要
1) 一句话总结
本文档汇总了75个高评分的AI记忆与上下文管理资源,涵盖了从底层向量数据库、通用记忆层到多智能体编排框架及前沿研究博客的开源项目与技术进展。
2) 核心要点
- 项目规模与质量:列表共包含75个开源代码库和技术博客,评分集中在89至100之间,重点聚焦于AI智能体(Agent)的长期记忆、RAG(检索增强生成)和上下文工程。
- 头部高星项目:最受关注的开源项目包括高吞吐量推理引擎
vllm(70,898 Stars)、AI通用记忆层mem0(47,773 Stars)以及生产级AI编排框架haystack(24,257 Stars)。 - 通用记忆层(Memory Layer)的崛起:涌现出大量旨在取代复杂RAG流水线的独立记忆层项目(如
memvid、supermemory、cognee、Memori),为AI智能体提供即时检索、SQL原生支持和持久化的长期记忆。 - MCP(模型上下文协议)的广泛集成:MCP 正在成为标准,多个项目(如
supermemory-mcp、mcp-memory-service、context-portal)利用该协议为不同的LLM、IDE(如 Cursor、VS Code)和工作流提供统一的记忆访问接口。 - RAG 技术的深度演进:RAG 正在与知识图谱和图数据库深度结合(如
HippoRAG引入个性化 PageRank,AutoMem提供关系型图向量记忆),以提升跨文档知识的持续整合能力。 - 端侧与本地轻量化方案:针对资源受限环境的记忆方案受到重视,例如适用于端侧的
Wax、总大小仅888KiB且可运行于ESP32微控制器的zclaw,以及100%本地运行的LocalRecall。 - 记忆标准化与格式化:行业开始探索智能体记忆的标准化,例如
agent-file提出了一种.af开放文件格式,用于在不同框架间序列化、共享和版本控制带有持久化记忆的AI智能体。 - 头部AI企业的技术聚焦:Google、DeepMind、Anthropic、Mistral 和 OpenAI 等企业密集发布了关于长上下文提示(Long Context)、上下文检索(Contextual Retrieval)以及智能体记忆系统构建的工程实践博客。
3) 风险/不足
(注:以下提取自原文明确提及的痛点或问题)
- 内存泄漏风险:在 LLM 高吞吐量推理引擎 vLLM 的工程实践中,存在需要专门调试的内存泄漏(Memory Leak)问题(来源:Mistral 博客)。
- 算力瓶颈:LLM Embedding 模型在 Query(查询)侧存在算力瓶颈,目前有最新研究(如 LightRetriever)正致力于从架构上彻底移走该瓶颈(来源:机器之心博客)。
正文
Top 10
- deepset-ai/haystack(评分:100,Stars:24257)
- memvid/memvid(评分:100,Stars:13179)
- panaversity/learn-agentic-ai(评分:100,Stars:3911)
- campfirein/cipher(评分:100,Stars:3529)
- volcengine/OpenViking(评分:100,Stars:3290)
- OSU-NLP-Group/HippoRAG(评分:100,Stars:3227)
- qhjqhj00/MemoRAG(评分:100,Stars:2210)
- neuron-core/neuron-ai(评分:100,Stars:1704)
- szczyglis-dev/py-gpt(评分:100,Stars:1626)
- supermemoryai/supermemory-mcp(评分:100,Stars:1616)
仓库清单
- deepset-ai/haystack(评分:100,Stars:24257)
- memvid/memvid(评分:100,Stars:13179)
- panaversity/learn-agentic-ai(评分:100,Stars:3911)
- campfirein/cipher(评分:100,Stars:3529)
- volcengine/OpenViking(评分:100,Stars:3290)
- OSU-NLP-Group/HippoRAG(评分:100,Stars:3227)
- qhjqhj00/MemoRAG(评分:100,Stars:2210)
- neuron-core/neuron-ai(评分:100,Stars:1704)
- szczyglis-dev/py-gpt(评分:100,Stars:1626)
- supermemoryai/supermemory-mcp(评分:100,Stars:1616)
- doobidoo/mcp-memory-service(评分:100,Stars:1356)
- moyangzhan/langchain4j-aideepin(评分:100,Stars:1168)
- philippgille/chromem-go(评分:100,Stars:868)
- heurist-network/heurist-agent-framework(评分:100,Stars:776)
- GreatScottyMac/context-portal(评分:100,Stars:740)
- verygoodplugins/automem(评分:100,Stars:619)
- wanxingai/LightAgent(评分:100,Stars:585)
- christopherkarani/Wax(评分:100,Stars:568)
- agentset-ai/agentset(评分:97,Stars:1869)
- vllm-project/vllm(评分:92,Stars:70898)
- mem0ai/mem0(评分:92,Stars:47773)
- steveyegge/beads(评分:92,Stars:16945)
- supermemoryai/supermemory(评分:92,Stars:16571)
- topoteretes/cognee(评分:92,Stars:12465)
- MemoriLabs/Memori(评分:92,Stars:12212)
- qwibitai/nanoclaw(评分:92,Stars:11756)
- NevaMind-AI/memU(评分:92,Stars:9745)
- rowboatlabs/rowboat(评分:92,Stars:8304)
- MemTensor/MemOS(评分:92,Stars:5732)
- MemMachine/MemMachine(评分:92,Stars:4646)
- CaviraOSS/OpenMemory(评分:92,Stars:3377)
- Josh-XT/AGiXT(评分:92,Stars:3153)
- aiming-lab/SimpleMem(评分:92,Stars:2998)
- basicmachines-co/basic-memory(评分:92,Stars:2549)
- griptape-ai/griptape(评分:92,Stars:2479)
- EverMind-AI/EverMemOS(评分:92,Stars:2158)
- parruda/swarm(评分:92,Stars:1642)
- letta-ai/letta-code(评分:92,Stars:1625)
- ComposioHQ/secure-openclaw(评分:92,Stars:1515)
- vectorize-io/hindsight(评分:92,Stars:1471)
- Shichun-Liu/Agent-Memory-Paper-List(评分:92,Stars:1258)
- CommandCodeAI/BaseAI(评分:92,Stars:1200)
- BAI-LAB/MemoryOS(评分:92,Stars:1193)
- StarlightSearch/EmbedAnything(评分:92,Stars:1161)
- letta-ai/agent-file(评分:91,Stars:1004)
- agentscope-ai/ReMe(评分:91,Stars:984)
- rohitg00/pro-workflow(评分:91,Stars:902)
- morettt/my-neuro(评分:91,Stars:866)
- memodb-io/memobase(评分:90,Stars:2568)
- SuanmoSuanyangTechnology/MemoryBear(评分:90,Stars:802)
- Growth-Kinetics/DiffMem(评分:90,Stars:787)
- tnm/zclaw(评分:90,Stars:759)
- mudler/LocalRecall(评分:90,Stars:757)
- RichmondAlake/memorizz(评分:90,Stars:687)
- Tencent/loli_profiler(评分:90,Stars:673)
博客清单
- How we built Agent Builder’s memory system(评分:98)
- Titans + MIRAS: Helping AI have long-term memory(评分:98)
- a new model and dataset for long range memory(评分:98)
- How to Use Memory in Agent Builder(评分:97)
- contextual retrieval(评分:97)
- effective context engineering for ai agents(评分:97)
- Context Management for Deep Agents(评分:96)
- memory(评分:96)
- prompting long context(评分:95)
- le chat mcp connectors memories(评分:95)
- debugging memory leak in vllm(评分:94)
- donating the model context protocol and establishing of the agentic ai foundation(评分:94)
- Harness engineering: leveraging Codex in an agent-first world(评分:93)
- code execution with mcp(评分:93)
- llm as rag judge(评分:92)
- rag architecture(评分:92)
- Introducing RTEB: A New Standard for Retrieval Evaluation(评分:91)
- GGML and llama.cpp join HF to ensure the long-term progress of Local AI(评分:90)
- Speech-to-Retrieval (S2R): A new approach to voice search(评分:90)
- ICLR 2026|把LLM Embedding Model算力瓶颈,从Query侧彻底移走,LightRetriever来了(评分:89)