摘要
arXiv:2503.22673v2 宣传类型: 替换
摘要:行为模型是使自主代理能够执行复杂任务的关键。然而,由于代理环境的多样性和代理数据的复杂性,训练大型行为模型仍然具有挑战性。尽管现有关心逐渐增长,现有基础设施为可扩展的、针对代理特定的微调提供了有限的支持。我们介绍了ActionStudio,一个为大型行为模型设计的轻量级和可扩展的数据和训练框架。ActionStudio 通过标准化格式统一了不同类型的代理轨迹,支持包括LoRA、全面微调和分布式设置在内的各种训练范式,并集成了 robust 的预处理和验证工具。我们在公共和现实工业基准测试上验证了其有效性,展示了其强大的性能和实用的可扩展性。我们已在 https://github.com/SalesforceAIResearch/xLAM 开放了代码和数据,以促进社区的研究。