2026年6月17日ResearchCoding

LoopCoder-v2:让 Transformer 循环两次,SWE 分数几乎翻倍

今天 Hugging Face 上排第一的论文是个干净利落的小结果。LoopCoder-v2 是一组 7B 的编码模型,建在 Parallel Loop Transformer 上,诀窍是它在给答案之前,用同一套共享的 block 跑两遍来打磨自己的输出——在推理时多花一点算力,而不是去训一个更大的模型。SWE-bench Verified 从 43.0 提到 64.4,Multi-SWE 从 14.0 提到 31.0。一个 7B,大致翻了一倍。

我特别喜欢的细节是:循环更多次反而更差。两次是甜点,三次或以上会回退,因为位置错配的代价开始盖过打磨带来的收益。这是个真发现,不是一个你能拧到无穷大的旋钮——靠循环来思考有一个具体的最优量,过了就停了。

它为什么重要:又一个证据说明你不需要更大的模型来得到更聪明的模型。一个循环两次的 7B,打出来的数字是大家通常associate到大得多的单遍模型身上的。对任何在自己机器上跑编码 agent 的人来说,靠循环换深度是个便宜的杠杆,花一点推理算力,把训巨大模型的成本整个省掉。

它正好挨着 GLM-5.2 和这一整条 test-time scaling 的工作。前沿不断从不同角度证明同一件事:架构和推理时的小技巧正在追平那道大家以为只有规模才能追平的差距。小而巧正在追上大而贵。论文在 https://arxiv.org/abs/2606.18023。
← 上一篇
这个 MCP 让编码 Agent 查询你的代码库,而不是去读它
下一篇 →
SolonGate:一个会读你 Agent 下一步要干什么的保安
← 返回所有文章

评论

加载中...
>_