LLM2D
多模态人工智能系统在视角转换中的失败
Failures in Perspective-taking of Multimodal AI Systems
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.13929v1

摘要

arXiv:2409.13929v1 公告类型: 新研究 摘要: 本研究扩展了多模态AI系统中空间表征的先前研究。尽管当前模型展示了从图像中理解空间信息的丰富能力,但这些信息基于命题表征,这与人类和动物空间认知中使用的类比表征有所不同。为进一步探讨这些局限性,我们应用认知和发展科学的技术来评估GPT-4o的视角转换能力。我们的分析使得人类大脑与多模态AI的认知发展得以比较,为未来的研究和模型开发提供了指导。