摘要
arXiv:2504.02793v1 宣告类型: 新
摘要:大型人工智能(AI)模型因其在标准化基准测试中的杰出表现,尤其是常被称为“超人”的表现,而受到了广泛关注。然而,当这些模型部署到高风险垂直领域,如医疗保健、教育和法律时,它们往往会展现出显著的局限性。例如,它们对输入数据的细微变化表现出脆弱性,关键场合下的决策缺乏情境相关信息,在自信地生成或再现错误信息时损害用户信任。在应用大型模型时遇到的这些挑战需要跨学科创新,以使模型的能力与实际应用的需求保持一致。我们引入了一个框架,通过逐层抽象创新以满足用户对大型模型的需求。通过多个案例研究,我们展示了不同领域的研究人员和实践者如何实现这一框架。除了模块化大型模型转换为有用的“垂直系统”的管道外,我们还强调了框架不同层次中存在的动态性。最后,我们讨论了框架如何指导研究人员和实践者:(i)优化其创新的定位(例如,当垂直领域特定见解能够赋能广泛影响的无特定垂直领域的创新时),(ii)发现被忽视的机会(例如,通过识别跨垂直领域的重复问题,来开发实践中有用的基础模型,而不是追求基准测试),以及(iii)促进关键挑战的跨学科沟通(例如,为AI开发人员、领域专家和人机交互学者提供共享词汇)。