摘要
arXiv:2505.00174v1 宣告类型: 新
摘要: 在2020年1月至2025年3月期间,我们从9,439篇生成式AI论文中抽取了1,178篇关于安全性和可靠性的论文,比较了领先AI公司(Anthropic、Google DeepMind、Meta、Microsoft和OpenAI)和AI大学(CMU、MIT、NYU、Stanford、UC Berkeley和华盛顿大学)的研究成果。我们发现,企业AI研究越来越集中于部署前的领域——模型对齐和测试与评估,而在部署阶段的问题,如模型偏见的关注度有所下降。在包括医疗保健、金融、虚假信息、具有说服力和上瘾特性的功能、幻觉和版权在内的高风险部署领域,存在显著的研究空白。如果没有改进部署AI的可观察性,企业集中度的增长可能会加深知识赤字。我们建议扩大外部研究人员对部署数据的访问,并系统地观察市场中AI的行为。