LLM2D

摘要

arXiv:2501.00953v2 宣告类型: replace-cross 摘要：赋予机器人说话能力的努力得益于自然语言处理领域的最新进展，特别是大型语言模型的进步。然而，目前的语言模型尚未完全实现增量处理，因为它们的处理本质上是单调的，因此缺乏在新观察结果出现时修订其解释或输出的能力。这种单调性对人类-机器人交互对话系统的开发具有重要意义。在这篇论文中，我们回顾了以增量方式（即在单词级别或更低级别）运行的交互系统文献。我们阐述了需要增量系统的理由，概述了对对话中重要方面（如语音识别和语言生成）的增量建模。重点是系统中做出决策的部分，即对话管理器。我们发现关于增量对话管理的研究非常少，提出了关于实际增量对话管理的一些要求，并探讨了在大型语言模型时代，增量对话如何影响具身的、机器人的平台。