摘要
arXiv:2503.22673v1 动作模型类型:新
摘要:动作模型是使自主代理能够执行复杂任务的关键。然而,由于代理环境的多样性以及代理数据的复杂性,训练大型动作模型仍然具有挑战性。尽管现有基础设施对可扩展的、特定代理的微调支持有限,但我们提出了一种名为ActionStudio的轻量级和可扩展的数据和训练框架,专门用于动作模型。ActionStudio通过标准化格式统一了异构代理轨迹,支持包括LoRA、完全微调和分布式设置在内的多种训练模式,并集成了强大的预处理和验证工具。我们通过跨公开和现实行业的基准测试验证了其有效性,展现出强大的性能和实际的可扩展性。我们已在https://github.com/SalesforceAIResearch/xLAM开放了代码和数据,以促进社区内的研究。