Agent 原生通讯协议：从传递代码，到传递认知

摘要

1) 一句话总结

前 GitHub CEO 创立的 Entire 推出 Checkpoint 工具，通过在 Git 提交中结构化记录 AI Agent 的推理过程与上下文，填补了传统版本控制缺失的“决策原因”，旨在构建 Agent 原生的协作基础设施。

2) 核心要点

现象演进：GitHub 的 Issue 和 PR 凭借其纯文本、命令式、结构化和版本控制的特性，正自然演变为 AI Agent 之间隐式的通讯协议。
商业动作：前 GitHub CEO Thomas Dohmke 创立新公司 Entire，获得 6000 万美元种子轮融资，致力于在 Git 之上构建专为 Agent 设计的开发者平台。
传统 Git 的局限：现有 Git 体系忠实记录了代码变更的“是什么、谁做的、时间和地点”，但缺失了 Agent 生成代码时的“为什么（推理链和决策权衡）”。
Checkpoint 机制：Entire 发布的首个产品 Checkpoint 在 Git 之上增加语义元数据层，将原始 Prompt、推理链、工具调用、约束条件和 Token 消耗与具体的 commit SHA 绑定。
兼容性设计：Checkpoint 的元数据以 append-only（仅追加）的方式存储在独立的 Git 分支（entire/checkpoints/v1）上，完全兼容现有 Git 工作流且不影响代码本身。
审查范式转变：代码审查从“逐行阅读 diff”转变为“审查 Agent 的意图、推理过程和决策合理性”。
角色转变：开发者的核心职责从“编写代码的工人”转变为“表达意图并审查 Agent 思维过程的监督者”。
产品架构规划：Entire 规划了三层架构：已发布的 Checkpoint（存储层），以及待发布的 Context Graph（语义推理与检索层）和 AI 原生开发生命周期（实时协调与工作流）。

3) 风险与缺口

上下文爆炸与检索难题：长期运行的项目可能累积海量数据（如 10M tokens），超出 Agent 的上下文窗口限制。目前 Checkpoint 解决了存储问题，但 Agent 如何从海量历史中精准提取有效信息仍是挑战（计划通过未来的 Context Graph 解决）。
缺乏实时协调机制：Checkpoint 本质上是“事后记录（post-commit）”，在多 Agent 团队并行协作时，无法满足实时通讯与状态同步的需求，可能导致并行工作时的方案不兼容。

正文

当 Agent 开始用 Git 说话：从一个 Vibe Coding 开发者的发现，到 Agent 协作的未来。

一个意外的发现

最近我在维护自己的开源项目时，做了一件很自然的事：让 AI Agent 帮我处理 GitHub 上的 Issues 和 PR。

一开始只是图省事——Issue 太多了，让 Agent 帮我读一读、分分类、回复一些常见问题。PR 也是，让 Agent 先做一轮 Code Review，帮我过滤掉明显有问题的提交。

但很快我发现了一件有趣的事情：给我提 Issue 的，很多也是 Agent；给我提 PR 的，也是 Agent。我的 Agent 在和别人的 Agent 对话。

它们用 Issue 的格式交换需求，用 PR 的格式交换代码，用 Comment 的格式讨论方案。没有人刻意设计过这套流程，但它就这么自然地发生了。那一刻我意识到——GitHub 正在无声无息地变成一种 Agent 之间的通讯协议。

仔细想想，这并不意外。GitHub 天然具备 Agent 通讯协议所需要的一切特性：

可读且安全：纯文本，所有操作透明可审计。
命令式的：Issue 是任务指令，PR 是执行结果。
结构化的：标签、模板、状态流转，天然适合机器解析。
有版本控制：每一次交互都被记录，不会丢失。

Agent 不需要什么新协议，它们已经在用人类建造的最成熟的协作基础设施来互相沟通了。

巧合还是必然？

昨天我刚和朋友聊完这个观察，今天早上就看到一条新闻：GitHub 前 CEO Thomas Dohmke 宣布创立新公司 Entire，拿了 6000 万美元种子轮，要在 Git 之上构建 Agent 时代的开发者平台。

有时候你模糊感知到的趋势，突然被行业里最懂这件事的人用一家公司、一笔融资、一个产品确认了——这种感觉很奇妙。

Thomas Dohmke 在公告里写了一句话，和我的感受完全一致：

“我们仍然依赖一个在云时代之前构建的软件开发生命周期，它天生是为人与人协作设计的。”

他看到的问题和我看到的一样：现有的 Git/GitHub 体系是为人设计的，Agent 在将就着用。能用，但不够。

Entire 与 Checkpoint：给 Git 补上 “Why”

Git 记录了什么，遗漏了什么

先回顾一下现有的 Git 体系。Git 是一个极其优秀的版本控制系统，它忠实记录了：

What：哪些文件变了，每一行的 diff
Who：谁提交的
When：什么时候提交的
Where：在哪个分支上

但它有一个致命的缺失：Why——为什么要这么改。

在人类手写代码的时代，这个“为什么”勉强可以通过 commit message 和 PR description 来补充。但在 Agent 时代，这个缺失被放大了一百倍。Agent 生成了 500 行代码，你只看到 diff，完全不知道它的推理链；Agent 做了一个架构决策，选了方案 A 放弃了方案 B，你不知道权衡了什么。你给 Agent 的 prompt、约束、讨论过程，在关闭终端的那一刻全部消失。

Git 保存了代码怎么变的，但丢掉了代码为什么这么变。

Entire 的 Checkpoint

Entire 发布的第一个产品叫 Checkpoint。它的做法很聪明——不修改 Git，而是在 Git 之上增加一层语义元数据。

当你用 Agent 生成代码并 commit 时，Checkpoint 自动捕获并绑定到这个 commit SHA 上：

普通 Git Commit：commit abc123 → diff（代码变更）
Entire Checkpoint：commit abc123 → diff（代码变更） + 原始 prompt（指令） + 推理链（考虑与放弃了什么） + 工具调用（读了哪些文件/API） + 约束条件（兼容性限制） + token 消耗 + 完整对话记录。

这些元数据存储在一个独立的 Git 分支（entire/checkpoints/v1）上，以 append-only 的方式追加。代码本身不受任何影响，完全兼容现有的 Git 工作流。本质上，Checkpoint 把 Agent 的“想法”从黑箱变成了白箱——可追溯、可审查、可共享。

为什么这件事比“存聊天记录”重要得多？

这不仅仅是把 AI 的聊天记录存到了 Git 里，区别在于它是结构化的、版本化的、绑定到代码变更的。这意味着：

代码审查的范式变了：过去你打开 PR 逐行读几千行 diff。现在你可以先看 Checkpoint，了解 Agent 接到的意图、考虑的方案以及选择当前实现的原因。你审查的不再是“代码对不对”，而是“思维过程合不合理”。
Agent 之间有了共享记忆：Agent A 做完技术选型后上下文消失，Agent B 接手时可以读取 Agent A 的 Checkpoint，直接继承决策和约束，无需从头推理。
决策历史可追溯：三个月后如果有人问“为什么选了 SQLite 而不是 PostgreSQL”，直接查那个 commit 的 Checkpoint，当初的完整讨论和推理都在。

新范式：从“写代码的工人”到“审查思维的监督者”

Entire 和 Checkpoint 指向的，其实是一个更深层的范式转变。

旧范式：

开发者写代码 → commit → 开 PR → 同事看 diff → 讨论 → merge (代码是核心产物，人的注意力集中在“这段代码写得对不对”。)

新范式：

表达意图 → Agent 生成 → Checkpoint 记录推理 → Review 意图和结果 → 验证正确性

每一步都发生了质变：

表达意图：开发者的第一步不再是写代码，而是用自然语言描述需求（如“需要一个 JWT 认证中间件…”）。意图本身成了工程产物。
Agent 生成：Agent 读项目、分析代码、权衡方案并生成代码。过去这些消耗大量算力的推理是瞬态的，现在被保留了下来。
Checkpoint 记录推理：推理过程被自动捕获，无需开发者手动写规则文件或技术文档。
Review 意图和结果：你不再逐行看代码，而是审查意图是否正确、决策是否合理、约束是否满足。你审查的是 Agent 的认知过程。
验证正确性：Agent 可以同时生成代码和测试，另一个 Agent 可以读取 Checkpoint 检查推理链是否自洽，业务指标自动验证结果。

一句话总结：人的角色从“写代码的工人”变成了“审查 Agent 思维过程的监督者”。

对 Agent 时代的意义

把 Entire 放到更大的背景下看，它的意义超越了一个开发工具。

Agent 的世界需要自己的“互联网” 旧世界里，HTTP 是人访问网站的协议；新世界里，Agent 需要自己的协作协议。目前 Agent 通过 Issues 和 PR 互相沟通是一种隐式的、低带宽的通讯。Entire 想做的是把这变成显式的、高带宽的通讯：不仅传代码，还传推理过程、上下文图谱、决策依据。这也是为什么 Entire 强调开源和独立，它在推行一个协议标准。

从 2C、2B 到 2A 过去软件服务消费者（2C）或企业（2B），未来最大的客户是 Agent（2A）。如果 Agent 是软件的新用户，Agent 之间的高效协作就是最关键的基础设施。Checkpoint 本质上就是让 Agent 协作“用得爽”的结构化推理数据。

“韩信点兵”需要指挥体系 未来人和人的差距，取决于你能驱动多少 Agent 为你工作。但驱动 100 个 Agent 如果没有协调体系，就会变成各自为战、重复推理的混乱。Entire 的三层架构对应的就是这个指挥体系：统一的信息存储、共享的态势感知、清晰的协作流程。

解决了什么，还有哪些挑战？

已经解决的问题

告别“人肉 Checkpoint”：作为重度 Vibe Coding 开发者，以前 AI 经常遗忘上下文，我不得不手动维护规则文件（如 CLAUDE.md）来保存架构决策。现在 Checkpoint 自动绑定每次对话和推理链到 commit 上，成为永久历史。回复历史 Issue 时，也能直接引用当时的推理，有理有据。
多 Agent 协作有了共享认知：在复杂的 Git worktree 工作流中，审查多个 Agent Teams 的产出非常痛苦。Checkpoint 让我可以直接对比不同方案的推理摘要和决策依据，5 分钟就能做出判断，而不需要逐行对比 diff。

尚未解决的问题

上下文爆炸问题：上下文窗口是有限的。一个运行三个月的项目可能累积 10M tokens 的数据，Agent 一次看不完。Checkpoint 解决了存储问题，但引入了检索问题——Agent 如何从海量历史中精准提取当前任务需要的有效信息？
从事后记录到实时协调：Checkpoint 本质上是“事后记录”。但在多 Agent 并行协作中，我们需要实时通讯。比如 Team 1 决定使用某种数据库，应该实时同步给并行的 Team 2，而不是等 commit 后才发现不兼容。

Entire 的解决思路

Entire 的完整愿景包含三层架构，恰好对应了这些挑战：

层次	解决什么	状态
Checkpoint（存储层）	信息不再丢失	✅ 已发布
Context Graph（语义推理层）	从海量 Checkpoint 中精准检索	🔜 待发布
AI 原生开发生命周期	Agent 间的实时协调与工作流	🔜 待发布

Context Graph 可能是最关键的一层。它需要做到根据当前任务语义，智能检索并分层压缩历史上下文（完整记录、决策摘要、关键约束）。就像人的记忆有遗忘曲线和按需回忆一样，Agent 也需要类似的智能检索和压缩机制。

结语

回到最初的发现：Agent 已经在用 GitHub 互相沟通了，这件事正在自然发生。

Entire 做的事情，是把这种自然发生的通讯，从隐式变成显式，从低带宽变成高带宽，从“将就着用人类的工具”变成“为 Agent 时代专门设计的基础设施”。

Checkpoint 是第一步——把 Agent 的思维过程从黑箱变成白箱。接下来的 Context Graph 和 AI 原生开发生命周期，才是真正让 Agent 之间高效协作的关键。

但最深刻的变化在角色层面：我们正在从“写代码的工人”变成“审查 Agent 思维过程的监督者”。

你不需要理解每一行代码怎么写的，但需要理解 Agent 的推理是否合理、决策是否正确、有没有遗漏关键约束。这是一种全新的能力，也是一种全新的责任。

旧世界的开发者用键盘写代码。新世界的开发者用判断力指挥 Agent。而 Entire 这样的基础设施，就是让这种指挥成为可能的指挥系统。

地基已经打下，让我们看看上面能建起什么。

wsl-docs

探索