LLM2D

摘要

arXiv:2406.16746v4 宣布类型: replace-cross 摘要：基础模型开发吸引了越来越多的贡献者、科学家和应用程序。为了帮助塑造负责任的开发实践，我们引入了《基础模型开发速查表》：一个涵盖250多种工具和资源的不断增长的集合，涉及文本、视觉和语音等多种模态。我们基于大量此前的工作对资源（例如软件、文档、框架、指南和实用工具）进行了调查，这些资源支持知情的数据选择、处理和理解、精确和具备局限性意识的文档、高效的模型训练、对训练环境影响的先进认识、谨慎的能力、风险和声明的模型评估，以及负责任的模型发布、许可和部署实践。希望这份精心挑选的资源集合能够引导更负责任的发展。在整理这份列表的过程中，我们得以审视AI开发生态系统，揭示了现有实践中的工具严重缺少、误用或过度使用的情况。我们发现：（i）用于数据来源、模型评估和监控的工具严重未能满足伦理和现实世界的需求；（ii）模型安全性、能力和环境影响的评估均缺乏可重复性和透明度；（iii）文本分析，特别是以英语为中心的分析，仍主导着多语言和多模态分析；（iv）需要对系统而非仅仅对模型进行评估，以便在上下文中评估能力和影响。