摘要
arXiv:2406.16746v4 宣布类型: replace-cross
摘要:基础模型开发吸引了越来越多的贡献者、科学家和应用程序。为了帮助塑造负责任的开发实践,我们引入了《基础模型开发速查表》:一个涵盖250多种工具和资源的不断增长的集合,涉及文本、视觉和语音等多种模态。我们基于大量此前的工作对资源(例如软件、文档、框架、指南和实用工具)进行了调查,这些资源支持知情的数据选择、处理和理解、精确和具备局限性意识的文档、高效的模型训练、对训练环境影响的先进认识、谨慎的能力、风险和声明的模型评估,以及负责任的模型发布、许可和部署实践。希望这份精心挑选的资源集合能够引导更负责任的发展。在整理这份列表的过程中,我们得以审视AI开发生态系统,揭示了现有实践中的工具严重缺少、误用或过度使用的情况。我们发现:(i)用于数据来源、模型评估和监控的工具严重未能满足伦理和现实世界的需求;(ii)模型安全性、能力和环境影响的评估均缺乏可重复性和透明度;(iii)文本分析,特别是以英语为中心的分析,仍主导着多语言和多模态分析;(iv)需要对系统而非仅仅对模型进行评估,以便在上下文中评估能力和影响。