storm：基于大语言模型（LLM）的知识管理与生成系统，能够通过互联网检索自动研究主题并生成带有引用的维基百科风格长篇报告

摘要

STORM 是一个基于大语言模型（LLM）的知识管理与生成系统，能够通过互联网检索自动研究主题并生成带有引用的维基百科风格长篇报告，其升级版 Co-STORM 进一步支持了人机协作探索。

项目基础：采用 Python 开发，基于 MIT 协议开源，目前已获得超 2.7 万 Stars，最新版本为 v1.1.0（2025年1月发布）。
STORM 工作流：分为“写作前（检索资料并生成大纲）”和“写作（基于大纲和参考资料生成带引用的全文）”两个阶段。
核心提问策略：采用“视角引导提问（发现不同视角以控制提问过程）”和“模拟对话（模拟维基百科作者与领域专家的对话）”来提升问题深度与广度。
Co-STORM 协作机制：引入了协作对话协议（包含 LLM 专家、主持人和人类用户三种角色），并维护一个动态更新的“思维导图”以降低长对话中的认知负荷。
模型与检索器支持：系统基于 dspy 构建，高度模块化；通过 litellm 集成了多种语言模型和嵌入模型；支持 Bing、You.com、DuckDuckGo 等多种搜索引擎，并提供 VectorRM 以支持基于用户本地文档的检索。
使用与部署：提供 knowledge-storm pip 安装包和基于 Streamlit 的本地演示界面，其在线研究预览版已有超 7 万人使用。
开源数据集：发布了 FreshWiki（包含 100 篇高质量维基百科文章）和 WildSeek（基于真实用户复杂信息检索意图）两个数据集以供学术研究。
未来规划：团队正在开发更多“人在回路（Human-in-the-Loop）”功能，并致力于支持维基百科风格之外的其他信息呈现格式。

An LLM-powered knowledge curation system that researches a topic and generates a full-length report with citations.