LLM2D
ActionStudio: 一个轻量级的大动作模型数据和训练框架
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models
作者: Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.22673v2

摘要

arXiv:2503.22673v2 宣传类型: 替换 摘要:行为模型是使自主代理能够执行复杂任务的关键。然而,由于代理环境的多样性和代理数据的复杂性,训练大型行为模型仍然具有挑战性。尽管现有关心逐渐增长,现有基础设施为可扩展的、针对代理特定的微调提供了有限的支持。我们介绍了ActionStudio,一个为大型行为模型设计的轻量级和可扩展的数据和训练框架。ActionStudio 通过标准化格式统一了不同类型的代理轨迹,支持包括LoRA、全面微调和分布式设置在内的各种训练范式,并集成了 robust 的预处理和验证工具。我们在公共和现实工业基准测试上验证了其有效性,展示了其强大的性能和实用的可扩展性。我们已在 https://github.com/SalesforceAIResearch/xLAM 开放了代码和数据,以促进社区的研究。