2026年6月23日AgentsFrameworkAPI

Sakana Fugu:把“调度”本身做成了模型

Sakana AI 在 6 月 22 号发了 Fugu,这是这个月最反共识的一次发布。别人都在抢着训一个更大的模型,Sakana 训了一个模型,它唯一的工作就是指挥别的模型。Fugu 是一套多 agent 调度系统,但它以单个基础模型的形态交付,藏在一个兼容 OpenAI 的接口后面。你只调一个 API,背后一个训练出来的“调度官”会把你的 prompt 动态分发给一堆 LLM(包括它自己的递归副本),再把结果综合成一个答案。

标语是“One Model to Command Them All”,卖的就是那个违反直觉的点:一支被好好调度的模型队伍,打得过任何单个模型。旗舰 Fugu Ultra 据称在最难的工程和推理基准上跟 Anthropic 的 Fable 5、Mythos 站在同一档。Sakana 想让你记住的那句话是“前沿能力,但没有出口管制的风险”,这是冲着所有担心被美国前沿模型断供的人说的,一点都不含蓄。

这不是随手攒的东西。它直接来自 Sakana 在 ICLR 2026 上的 TRINITY 和 Conductor 两篇论文,那两篇搞清楚了怎么训一个语言模型去把任务路由给专家 agent、再合并它们的输出。Fugu 就是把这套研究变成了一个你能付费用的产品:输入 5 美元每百万 token,输出 30 美元,外加 20、100、200 美元每月的订阅档。

有个值得坐下来想想的张力。Fugu 说你能靠调度模型摸到前沿,而就在同一周,PlanBench-XL 证明了哪怕是 GPT-5.4 的工具调用规划,一旦工具开始出故障,就会从 52% 崩到 11%。调度很强大,调度又很脆弱,两件事同时成立。Sakana 赌的是强大那一半会赢。发布在 sakana.ai/fugu-release。
← 上一篇
Anthropic 把 Claude 塞进你的 Slack,当一个真同事用
下一篇 →
PlanBench-XL:把工具弄坏,agent 就崩了
← 返回所有文章

评论

加载中...
>_