LLM2D

摘要

arXiv:2503.22673v2 宣传类型: 替换摘要：行为模型是使自主代理能够执行复杂任务的关键。然而，由于代理环境的多样性和代理数据的复杂性，训练大型行为模型仍然具有挑战性。尽管现有关心逐渐增长，现有基础设施为可扩展的、针对代理特定的微调提供了有限的支持。我们介绍了ActionStudio，一个为大型行为模型设计的轻量级和可扩展的数据和训练框架。ActionStudio 通过标准化格式统一了不同类型的代理轨迹，支持包括LoRA、全面微调和分布式设置在内的各种训练范式，并集成了 robust 的预处理和验证工具。我们在公共和现实工业基准测试上验证了其有效性，展示了其强大的性能和实用的可扩展性。我们已在 https://github.com/SalesforceAIResearch/xLAM 开放了代码和数据，以促进社区的研究。