LLM2D
空间推理器:XR 应用的 3D 推理管道
Spatial Reasoner: A 3D Inference Pipeline for XR Applications
作者: Steven H\"asler, Philipp Ackermann
发布日期: 4/28/2025
arXiv ID: oai:arXiv.org:2504.18380v1

摘要

arXiv:2504.18380v1 声称类型: cross 摘要:现代扩展现实 XR 系统提供了丰富的图像数据分析和传感器输入融合,从而要求 AR/VR 应用能够以语义方式推理 3D 场景。我们提出了一种空间推理框架,该框架将几何事实与符号谓词和关系相结合,以处理诸如确定 3D 对象之间如何排列('on', 'behind', 'near' 等)等关键任务。该框架的基础是带有综合空间谓词的有向 3D 紧密包表示,这些空间谓词涵盖了从拓扑和连通性到方向性和方位性的范围,在形式上与自然语言相关。导出的谓词形成了空间知识图谱,与基于管道的推理模型相结合,可以执行空间查询和动态规则评估。客户端和服务器端的实现展示了该框架高效地将几何数据转换为可操作知识的能力,确保在复杂 3D 环境中实现可扩展且技术独立的空间推理。空间推理框架正在促进空间本体的创建,并与机器学习、自然语言处理和规则系统无缝集成,从而增强 XR 应用程序。