LLM2D

摘要

arXiv:2503.21668v1 宣布类型: 新摘要: 我们世界模型的核心组件之一是“直观物理”——对物体、空间和因果关系的理解。这种能力使我们能够预测事件、规划行动并导航环境，所有这些都依赖于对物体概念的综合感知。尽管这一点很重要，但并没有单一、统一的物体概念解释，尽管有几个理论框架提供了见解。在本文的第一部分，我们对物体概念研究中的主要理论框架——格式塔心理学、活性认识论和发展心理学——进行了全面概述，并指出了每个框架赋予物体理解的核心能力，以及它们在生物体的世界模型构建中的功能性作用。鉴于物体概念在世界建模中的基础性作用，了解物体概念对于人工智能也同样至关重要。在本文的第二部分中，我们评估当前人工智能范式如何以及在多大程度上采用和测试物体概念能力，与认知科学中的能力相比较。我们定义一个人工智能范式为关于物体概念如何被构想、研究物体概念所使用的方法、所利用的数据以及评估方法的组合。我们发现，虽然基准可以检测到人工智能系统建模了物体概念的孤立方面，但基准无法检测到这些能力之间的功能整合缺失，因此无法全面解决物体概念挑战。最后，我们探讨了与本文中提出的集成的物体概念愿景相一致的新颖评估方法。这些方法是朝着从孤立的物体能力向在真实世界背景下具有真正物体理解的通用人工智能迈进的有希望的方法。