LLM2D

摘要

arXiv:2503.21668v2 更新类型: 修订摘要: 我们世界模型的核心组件之一是“直觉物理”——对物体、空间和因果关系的理解。这种能力使我们能够预测事件、制定行动计划并导航环境，所有这些都需要一种综合的物体概念。尽管其重要性不言而喻，但物体概念尚无单一、统一的解释，尽管有多个理论框架提供了洞见。在本文的第一部分中，我们概述了物体概念研究中的主要理论框架——格式塔心理学、践行认知和发展心理学——并确定了每种框架归因于物体理解的核心能力以及它们在塑造生物体世界模型方面的功能性角色。鉴于物体概念在世界建模中的基础性作用，理解物体概念对人工智能也同样重要。在本文的第二部分中，我们评估了当前的人工智能范式如何处理和测试与认知科学中物体概念相关的技能。我们定义一个人工智能范式为物体概念的构想方式、研究物体概念的方法、使用的数据以及评估技术的组合。我们发现，虽然基准测试可以检测到人工智能系统模拟物体概念的孤立方面，但这些基准测试无法检测到当人工智能系统在这些能力之间缺乏功能整合时的情况，不能完全解决物体概念的挑战。最后，我们探索了与本文中概述的综合物体概念愿景相一致的新颖评估方法。这些方法是朝着在现实世界情境中实现具有真正物体理解的通用人工智能的孤立物体能力的前景候选人。