Appearance
Multica 会让派发 AI agent 任务变得更顺手,也会让 token 成本更隐蔽。后台任务会读上下文、探索代码、调用工具,失败后还可能重试。控制成本的关键不是少用 AI,而是把任务写小、写清楚,先验证单任务,再考虑多 agent 并行。
Multica 的 token 成本怎么控制:别让后台任务悄悄烧钱
后台任务最吓人的地方,是你没盯着它的时候它也在读文件。
Multica 的界面会让派任务变得很自然。
写一个 issue,分给 agent,任务进入队列。你去做别的事,agent 在后台跑。听起来挺舒服。
成本也藏在这里。
每个 agent 运行时都要读上下文。它可能会探索项目结构,打开文件,理解任务,调用工具。任务失败了,有些情况还会重试。
这些动作背后都是真实 token。
直接对话和后台任务的感受不一样
你直接用 Claude Code 时,多少能感觉到模型在干什么。
它读了哪些文件,问了什么问题,准备怎么改,你在对话里看得到。觉得它跑偏了,可以马上打断。
Multica 这种任务平台不一样。
你把任务派出去,agent 在后台执行。页面会告诉你状态,但你不会像盯着终端那样盯着每一步。
这会带来一种心理错觉:反正它自己跑,成本就没那么明显。
可模型不会因为你没看,就少消耗。
模糊任务最贵
“帮我优化一下项目”这种任务,最容易烧 token。
agent 不知道你要优化什么,就会先探索。看目录,看配置,看代码,看 README。探索一圈以后,它可能还是要猜。
猜错了,你再让它改。
成本就这样叠上去。
Multica 让任务派发更顺手,所以更要避免把模糊需求直接丢进去。
一个便宜的任务,通常长这样:范围小,文件少,完成标准清楚。
比如“把 docs 里某篇文章的 frontmatter 补齐,不改正文”。这类任务 agent 不需要大范围探索。
一个贵的任务,通常长这样:目标大,边界松,还要求 agent 自己判断什么叫好。
多 agent 并行会放大成本
并行不是免费加速。
你开三个 agent,就有三份上下文读取、三次代码探索、三套工具调用。它们还可能读到很多相同文件。
如果任务之间有重叠,成本会更难看。
一个 agent 在查 auth,另一个也在查 auth。一个准备改接口,另一个也打开同一组文件。你以为是在分工,实际可能是在重复探索。
这不是 Multica 特有的问题。所有多 agent 系统都会遇到。
Multica 只是让你更容易启动这些任务。
怎么控制成本
我会用几个很笨的规则。
先跑单任务。
单任务能稳定完成,再开并行。不要一上来就把十个 issue 全派出去。
任务说明里写范围。
告诉 agent 只看哪些目录,哪些文件不要碰。范围越清楚,探索越少。
把验证方式写进去。
agent 知道怎么证明任务完成,就不容易到处试。
把探索任务和修改任务拆开。
比如先让 agent 做代码搜索报告,不改文件。你确认方向后,再派一个具体修改任务。看起来多一步,常常更省。
还有一个现实办法:给不同 provider 分不同任务。
不是所有任务都需要最贵的模型。文档整理、重复检查、简单格式修复,可以交给成本更低的 provider。涉及架构和复杂代码,再用你最信任的工具。
成本不是只看钱
token 成本当然是钱。
还有时间成本。
后台任务跑了十分钟,交回来一个不能用的 diff。你要 review,要回滚,要重新解释。这个时间也算成本。
还有注意力成本。
任务越多,状态越多,你就要记住每个 agent 在做什么。Multica 能帮你集中展示,但不能替你判断哪些结果值得保留。
所以我不太建议把 Multica 当成“多开几个 AI 就更快”的工具。
更稳的理解是:它让你更容易管理已经想清楚的小任务。
任务没想清楚时,先别派。去喝口水,回来把需求写窄一点。这个动作不花 token。