LLM2D
增量对话和机器人动作管理在语言模型时代之前的教训
Prior Lessons of Incremental Dialogue and Robot Action Management for the Age of Language Models
作者: Casey Kennington, Pierre Lison, David Schlangen
发布日期: 4/3/2025
arXiv ID: oai:arXiv.org:2501.00953v2

摘要

arXiv:2501.00953v2 宣告类型: replace-cross 摘要:赋予机器人说话能力的努力得益于自然语言处理领域的最新进展,特别是大型语言模型的进步。然而,目前的语言模型尚未完全实现增量处理,因为它们的处理本质上是单调的,因此缺乏在新观察结果出现时修订其解释或输出的能力。这种单调性对人类-机器人交互对话系统的开发具有重要意义。在这篇论文中,我们回顾了以增量方式(即在单词级别或更低级别)运行的交互系统文献。我们阐述了需要增量系统的理由,概述了对对话中重要方面(如语音识别和语言生成)的增量建模。重点是系统中做出决策的部分,即对话管理器。我们发现关于增量对话管理的研究非常少,提出了关于实际增量对话管理的一些要求,并探讨了在大型语言模型时代,增量对话如何影响具身的、机器人的平台。