LLM2D

摘要

arXiv:2503.22673v1 动作模型类型：新摘要：动作模型是使自主代理能够执行复杂任务的关键。然而，由于代理环境的多样性以及代理数据的复杂性，训练大型动作模型仍然具有挑战性。尽管现有基础设施对可扩展的、特定代理的微调支持有限，但我们提出了一种名为ActionStudio的轻量级和可扩展的数据和训练框架，专门用于动作模型。ActionStudio通过标准化格式统一了异构代理轨迹，支持包括LoRA、完全微调和分布式设置在内的多种训练模式，并集成了强大的预处理和验证工具。我们通过跨公开和现实行业的基准测试验证了其有效性，展现出强大的性能和实际的可扩展性。我们已在https://github.com/SalesforceAIResearch/xLAM开放了代码和数据，以促进社区内的研究。