LLM2D

摘要

arXiv:2504.02793v1 宣告类型: 新摘要：大型人工智能（AI）模型因其在标准化基准测试中的杰出表现，尤其是常被称为“超人”的表现，而受到了广泛关注。然而，当这些模型部署到高风险垂直领域，如医疗保健、教育和法律时，它们往往会展现出显著的局限性。例如，它们对输入数据的细微变化表现出脆弱性，关键场合下的决策缺乏情境相关信息，在自信地生成或再现错误信息时损害用户信任。在应用大型模型时遇到的这些挑战需要跨学科创新，以使模型的能力与实际应用的需求保持一致。我们引入了一个框架，通过逐层抽象创新以满足用户对大型模型的需求。通过多个案例研究，我们展示了不同领域的研究人员和实践者如何实现这一框架。除了模块化大型模型转换为有用的“垂直系统”的管道外，我们还强调了框架不同层次中存在的动态性。最后，我们讨论了框架如何指导研究人员和实践者：（i）优化其创新的定位（例如，当垂直领域特定见解能够赋能广泛影响的无特定垂直领域的创新时），（ii）发现被忽视的机会（例如，通过识别跨垂直领域的重复问题，来开发实践中有用的基础模型，而不是追求基准测试），以及（iii）促进关键挑战的跨学科沟通（例如，为AI开发人员、领域专家和人机交互学者提供共享词汇）。