为什么感觉现在AI Agent都是雷声大雨点小？

摘要

1) 一句话总结 本文指出了当前 AI Agent 面临的工具受限、扩展性差及成本高等痛点，并介绍了一种旨在打破预定义工具限制的“Python-use”新范式。

2) 核心要点

3) 风险/不足 （注：以下为原文明确指出的当前 Agent 框架存在的硬伤/不足）

工具扩展性差：自定义工具（如处理特定格式的 Excel）需要手动编写 Tool 类、定义 Schema 并注册，流程比直接编写 Python 脚本更繁琐。
推理成本高昂：每次执行任务需走完整的推理链路，中间任何一步出错都必须全部重来，导致 Token 消耗极快且用户体验差。
复杂任务易“罢工”：当遇到复杂任务且没有现成可调用的工具时，Agent 会直接拒绝执行。

最近一年多接触了各种 AI Agent，说实话实际体验下来确实让人有些失望。

以最近的 GPT-5 为例，使用下来发现它的工具调用能力确实比 GPT-4 强了很多，函数参数填写的准确率也有了明显提升。但核心痛点依然存在：Agent 能调用的工具太有限了。

这也引申出了目前 Agent 框架普遍存在的几个硬伤。

工具扩展性差 我之前用 LangChain 做过一个项目，想让 Agent 处理一些特定格式的 Excel 文件。结果发现，要么只能用现成的工具凑合，要么就得自己写 Tool 类、定义 Schema，然后再注册到框架里。整个流程折腾下来，甚至比自己直接写 Python 脚本还要麻烦。
推理成本高昂 每次 Agent 执行任务都要走完整的推理链路，中间任何一步出错就得全部重新来过。这不仅导致 Token 烧得飞快，整体的用户体验也很差。
面对复杂任务容易“罢工” 最让人绷不住的是，当遇到复杂任务且没有现成可调用的工具时，Agent 甚至会直接摊牌不干。

面对这些局限性，最近了解到国内某团队提出的“Python-use”范式，感觉思路非常有意思。

他们的核心观点是：既然 LLM 写代码的能力已经足够强了，为什么还要把它限制在预定义的工具集里？ 这种打破传统预定义工具限制的视角，或许能为当前 Agent 的发展提供一种全新的解法。