FastContext:给编程 agent 配个侦察兵
微软和上海交大有一个让编程 agent 又更强又更省的干净思路:别再逼主 agent 把整个仓库读一遍。FastContext 在 HuggingFace 上拿了 312 个赞,代码在 github.com/microsoft/fastcontext,它训练了一个专门的探索子 agent,唯一的活就是去找相关代码、并行发一堆搜索、然后把精确到文件和行号的引用扔回来,而不是把一堆探索性的阅读塞进主 agent 的上下文窗口。
数字就是全部的论据。接到 Mini-SWE-Agent 上,端到端解决率最多提升 5.5 个百分点,同时主 agent 的 token 消耗最多砍掉 60%,在 SWE-bench Multilingual、SWE-bench Pro、SWE-QA 三个 benchmark 上都测了。探索子 agent 从 4B 到 30B 都训了,用的是监督微调加强化学习。说白了就是派个侦察兵先去探路,而不是让整支部队挨条巷子走一遍。将军永远只看到那张地图上真正重要的那块。
这是整个领域换着角度反复学到的同一课:上下文才是稀缺资源,谁浪费得最少谁就赢。这个主题从 turbovec、到各种仓库探索的工作、到 Is Grep All You Need,一路都在出现。FastContext 是目前为止把搜索和求解分开这件事做得最干净的一个数据点,它真正重要的地方在于它是一个可训练的子 agent,不是一个 prompt 小技巧。这个能力存在可以复用的权重里,而不是你每次都得粘一遍的那句聪明指令。论文:https://huggingface.co/papers/2606.14066
← 返回所有文章
数字就是全部的论据。接到 Mini-SWE-Agent 上,端到端解决率最多提升 5.5 个百分点,同时主 agent 的 token 消耗最多砍掉 60%,在 SWE-bench Multilingual、SWE-bench Pro、SWE-QA 三个 benchmark 上都测了。探索子 agent 从 4B 到 30B 都训了,用的是监督微调加强化学习。说白了就是派个侦察兵先去探路,而不是让整支部队挨条巷子走一遍。将军永远只看到那张地图上真正重要的那块。
这是整个领域换着角度反复学到的同一课:上下文才是稀缺资源,谁浪费得最少谁就赢。这个主题从 turbovec、到各种仓库探索的工作、到 Is Grep All You Need,一路都在出现。FastContext 是目前为止把搜索和求解分开这件事做得最干净的一个数据点,它真正重要的地方在于它是一个可训练的子 agent,不是一个 prompt 小技巧。这个能力存在可以复用的权重里,而不是你每次都得粘一遍的那句聪明指令。论文:https://huggingface.co/papers/2606.14066
评论