LLM2D

摘要

当前针对强大 AI 能力的监管措施狭隘地聚焦于“基础”或“前沿”模型。然而，这些术语模糊且定义不一致，导致治理工作基础不稳。至关重要的是，政策辩论往往忽视了这些模型所使用的数据，尽管数据与模型性能之间存在明显的关联。即使是（相对）“小型”模型，只要接触到足够特定的数据集，也能在典型基础模型和前沿模型定义之外实现等效的结果。在本研究中，我们阐明了将数据集规模和内容视为评估模型当前和未来风险的重要因素。更广泛地说，我们强调了过度反应性监管带来的风险，并提供了一条通往谨慎、定量评估能力的道路，这将有助于简化监管环境。