摘要

1) 一句话总结 蚂蚁集团推出的 Tbox 是一款面向零基础用户的通用 Agent 平台,支持一键使用预设的多 Agent 协同完成复杂任务(如制作 PPT、网页开发),并允许用户通过简单步骤搭建专属的多 Agent 团队。

2) 核心要点

  • 零门槛定位:Tbox 专为没有编程基础的用户设计,无需复杂的学习过程即可体验和搭建自动化工作流。
  • 预设 Agent 体验(以 PPT 为例):官方预设的 PPT 制作小组能自动搜索中文网络信息、真实图片和模板,打破固定排版(支持多列、时间轴等),且下载的本地 PDF/PPT 无乱码。
  • 基础网页开发能力:Tbox 具备开发常见交互式网页的能力(如带状态更新的背单词网页),整体表现优于单一模型。
  • 丰富的组件与生态:支持接入支付宝、MiniMax、夸克搜索等 MCP(模型上下文协议),并允许在智能体广场招募现成的 Agent。
  • 自定义多 Agent 团队:用户可按需组建专属团队,例如由直译、意译、质检、溯源、图片搜索及网页研发 Agent 组成的“翻译大师团”。
  • 极简搭建步骤:单工作流 Agent 的搭建仅需三步:1)新建应用并选择“工作流”模式;2)配置模型(支持 DeepSeek、Qwen、智谱、Kimi 等)与插件;3)发布并上架至协同操作。
  • 自动化协同调度:Tbox 拥有主 Agent,能够自动解析任务、拆解调用顺序,并自主决定团队内各 Agent 的分工与合作。

正文

六个月前,Agent 们开始抢占 AI PPT 的活,现在已经卷到一句话能做出每页不同排版、包含真实图片和 AI 图片的 PPT 了。

很多朋友说,他们喜欢我分享的那些 AI Agent 的最新进展,觉得那些自动化工作流、AI 自主搭建应用程序的案例(如 n8n、dify、扣子)酷到封神。但兴奋过后,基本上会跟着一句提问:“看起来好复杂,是不是懂编程才能玩?我看不懂,是不是跟不上了?”

我觉得不是的。每当看到这样的留言,我都会有些自责:是不是把 AI 讲得太高深,把门槛无意中抬太高了?有没有一条路,能让零基础的朋友们,在一篇文章的时间里,就能亲手组建起属于自己的第一支 Agent 团队呢?

所以我挑中了蚂蚁集团的通用 Agent——Tbox(🔗 https://www.tbox.cn)。

我们将从使用预设的多 Agent 开始,再到培养一个属于我们自己的专属 Agent 小组。制作出来的 Agent 甚至还可以结合支付宝 MCP,自动 kuku 收钱。Here we go!

体验官方预设 Agent 小组:一键生成高质量 PPT

第一步,先感受一下官方预设的 Agent 小组们。

以常见的 PPT 制作为例。假设我是一个大学生,需要在开学的社团招新活动上,做一份介绍天文学社的 PPT。我只需在 Tbox 里,选择预设的 PPT 小组,对它说出我的需求:

“帮我做一份天文学社的招新 PPT,风格要年轻有趣,内容要包含天文学的魅力、我们社团的日常活动,以及如何加入我们,记得多用一些带有时间轴的图表来展示社团的发展历史。”

Tbox 的处理过程有以下几个亮点:

  • 丰富的信息源与素材:Tbox 集中在中文网站搜索信息,不仅如此,它还会搜 PPT 模板和相关的图片。看多了 AI 生成的图片,突然来几张真实的网图反而显得特别真。
  • 打破固定排版:Tbox 会将天文学常用的 PPT 模板融合整理成统一的风格,脱离了 AI 生成的固定模板,提供三列、双列、单列、左图右文、时间轴等不同的页面排版。
  • 无乱码下载:解决了一个比较痛的点,生成后下载到本地的 PDF 和 PPT 都没有出现乱码。

整个过程,几乎没有任何学习成本。

进阶能力:基础网页开发

One More Thing,Tbox 本身还可以做一些基础开发,用来开发常见的可互动网页是够用的,整体水平优于单个模型。

例如,开发出来的“背单词网页”可以切换页面、更新模块状态,完成单词学习、记忆测试和进度跟踪。(🔗 https://www.tbox.cn/agents/sharePage?conversationId=cbazbMofMvd2sSqGGEXEvD)

亲手打造专属 Agent 团队:翻译大师团

热身结束,是时候培养我们的第一个 Agent 小组了。

首先看看我们能用的零件(MCP)有多少:目前有比较好用的支付宝 MCP、MiniMax MCP、夸克搜索 MCP 等。同时,也可以去智能体广场招募现成的 Agent。

那我们就来做一个最常见的“翻译大师团”吧,成员包括:

  • 直译 Agent
  • 意译 Agent
  • 质检 Agent:用来对比“直译版”与“意译版”,生成满分融合稿。
  • 溯源 Agent:识别文本中的可核实事实(如数据、专名、引语、标准号、地名、法条等)。
  • 图片搜索助手 & 网页研发工程师:从广场招募,通过它们将翻译好的文本变成好看的解读报告。

这个名单够豪华了吧,做出来是真能收费的。(注:每个 Agent 的提示词都打包成文档了,公众号回复 tbox 即可获取)。

单工作流 Agent 搭建指南

先看看一个完整的单工作流 Agent 是如何诞生的,只需简单三步:

  1. 新建应用与模式选择:在 Tbox 新建应用后有两个构建方式(简单构建和工作流)。我们要做 Agent 小组的话就选择“工作流”,其他设置保持默认。
  2. 配置模型与插件:选择 DeepSeek、Qwen、智谱、Kimi 系列的模型,挑选合适的 MCP(我这里选的是文件读取),然后就可以调试了。So easy,哪里不会点哪里。
  3. 发布与上架:点击发布,再切换到 Tbox 智能体协同操作上架就好了。

重复这三步,我们就可以搭出其他三个 Agent,凑齐团队组队出道。

多 Agent 协同工作与效果展示

Tbox 有一个主 Agent,它可以读取小组之间的协作关系,自己决定 Agent 们如何分工合作。到这一步,我们就完成了自己的 Agent 团队搭建了。

实际效果测试: 我输入了一篇最近几天发布的论文片段。首先,Tbox 会拆解出调用的顺序和每个 Agent 的目标;随后输出意译出来的部分结果;最后结合配图和开发,做出来最终的展示网页。效果还是蛮不错的。

结语

现在是时候回收开头了。

不需要硬看几小时的入门视频,也不用担心几十页入门文档里漏掉什么,因为你已经走完了体验多 Agent、搭建单 Agent,再到组建自己的 Agent 团队的路。

看不懂那些复杂的平台,没有关系。你没有错过任何东西,因为一趟更开放、更包容、名为 Tbox 的列车,才刚到站。

现在上车刚刚好。

关联主题