LLM2D

摘要

arXiv:2410.16668v3 公告类型: replace-cross 摘要：增强现实（AR）辅助越来越多地用于支持用户完成物理任务，如组装和烹饪。然而，大多数系统依赖于由用户输入触发的反应性响应，忽视了丰富的环境和用户特定的信息。为了解决这一问题，我们提出了Satori，一种新颖的AR系统，它主动引导用户，同时建模他们的心理状态和环境上下文。Satori将Belief-Desire-Intention（BDI）框架与最先进的多模态大语言模型（LLM）相结合，以提供适当的上下文指导。我们的系统基于对十二名专家进行的两阶段形成性研究设计。我们在十六项以内被试研究中评估了系统，并发现Satori在无需手动配置或启发式方法的情况下，匹配了设计师创建的Wizard-of-Oz（WoZ）系统的性能，从而提高了通用性、重用性，并扩展了AR辅助的潜在应用。