LLM2D
Home
Arxiv
返回列表
一个自我改进的编码代理
A Self-Improving Coding Agent
作者:
Maxime Robeyns, Martin Szummer, Laurence Aitchison
发布日期:
4/22/2025
arXiv ID:
oai:arXiv.org:2504.15228v1
摘要
arXiv:2504.15228v1 更新类型: 新 摘要: 我们展示了配备基本编码工具的LLM编码代理能够自主编辑自己,并进而提高其在基准任务上的性能。我们在SWE Bench Verified的随机子集中获得了17%到53%的性能提升,并且在LiveCodeBench和合成生成的代理基准测试中还获得了额外的性能提升。我们的工作代表了自主系统自动化和开放设计的一个进步,并为寻求在工具使用和其他自主任务上后训练LLM的人提供了一个参考代理框架。
查看原文
下载 PDF