LLM2D

摘要

arXiv:2504.11419v1 体カ类型: 新摘要：理解人工智能系统如何发展空间意识和推理一直以来都是人工智能研究中的一个挑战。传统的模型往往依赖于被动观察，但体现认知理论认为，更深入的理解通过与环境的积极互动而浮现。本研究探讨了神经网络是否可以通过互动自主 internal化空间概念，重点关注平面导航任务。使用门控循环单元（GRUs）结合元强化学习（Meta-RL），我们展示了智能体可以学习编码方向、距离和障碍物避让等空间属性。我们引入了混合动力系统（HDS）来建模智能体和环境之间的互动，作为一个封闭的动力系统，揭示了对应于最优导航策略的稳定极限环。棱脊表示法使我们能够将导航路径映射到固定维度的行为空间中，从而便于与神经状态进行比较。校准相关分析（CCA）证实了这些表示之间的强烈对齐，表明智能体的神经状态积极地编码了空间知识。干预实验进一步表明特定的神经维度与导航性能之间存在因果联系。这项工作提供了一种连接人工智能中行动与感知之间差距的方法，为构建能够跨复杂环境泛化的适应性、可解释模型提供了新的见解。神经表示的因果验证也为理解和控制人工智能系统的内部机制开辟了新的途径，推动了在动态、现实世界场景中机器如何学习和推理的边界。