LLM2D
负责任的基金会模型开发速查指南:工具与资源综述
The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources
作者: Shayne Longpre, Stella Biderman, Alon Albalak, Hailey Schoelkopf, Daniel McDuff, Sayash Kapoor, Kevin Klyman, Kyle Lo, Gabriel Ilharco, Nay San, Maribeth Rauh, Aviya Skowron, Bertie Vidgen, Laura Weidinger, Arvind Narayanan, Victor Sanh, David Adelani, Percy Liang, Rishi Bommasani, Peter Henderson, Sasha Luccioni, Yacine Jernite, Luca Soldaini
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2406.16746v4

摘要

arXiv:2406.16746v4 宣布类型: replace-cross 摘要:基础模型开发吸引了越来越多的贡献者、科学家和应用程序。为了帮助塑造负责任的开发实践,我们引入了《基础模型开发速查表》:一个涵盖250多种工具和资源的不断增长的集合,涉及文本、视觉和语音等多种模态。我们基于大量此前的工作对资源(例如软件、文档、框架、指南和实用工具)进行了调查,这些资源支持知情的数据选择、处理和理解、精确和具备局限性意识的文档、高效的模型训练、对训练环境影响的先进认识、谨慎的能力、风险和声明的模型评估,以及负责任的模型发布、许可和部署实践。希望这份精心挑选的资源集合能够引导更负责任的发展。在整理这份列表的过程中,我们得以审视AI开发生态系统,揭示了现有实践中的工具严重缺少、误用或过度使用的情况。我们发现:(i)用于数据来源、模型评估和监控的工具严重未能满足伦理和现实世界的需求;(ii)模型安全性、能力和环境影响的评估均缺乏可重复性和透明度;(iii)文本分析,特别是以英语为中心的分析,仍主导着多语言和多模态分析;(iv)需要对系统而非仅仅对模型进行评估,以便在上下文中评估能力和影响。