LLM2D

摘要

arXiv:2505.00174v1 宣告类型: 新摘要: 在2020年1月至2025年3月期间，我们从9,439篇生成式AI论文中抽取了1,178篇关于安全性和可靠性的论文，比较了领先AI公司（Anthropic、Google DeepMind、Meta、Microsoft和OpenAI）和AI大学（CMU、MIT、NYU、Stanford、UC Berkeley和华盛顿大学）的研究成果。我们发现，企业AI研究越来越集中于部署前的领域——模型对齐和测试与评估，而在部署阶段的问题，如模型偏见的关注度有所下降。在包括医疗保健、金融、虚假信息、具有说服力和上瘾特性的功能、幻觉和版权在内的高风险部署领域，存在显著的研究空白。如果没有改进部署AI的可观察性，企业集中度的增长可能会加深知识赤字。我们建议扩大外部研究人员对部署数据的访问，并系统地观察市场中AI的行为。