LLM2D

摘要

arXiv:2409.13929v1 公告类型: 新研究摘要: 本研究扩展了多模态AI系统中空间表征的先前研究。尽管当前模型展示了从图像中理解空间信息的丰富能力，但这些信息基于命题表征，这与人类和动物空间认知中使用的类比表征有所不同。为进一步探讨这些局限性，我们应用认知和发展科学的技术来评估GPT-4o的视角转换能力。我们的分析使得人类大脑与多模态AI的认知发展得以比较，为未来的研究和模型开发提供了指导。