LLM2D

摘要

arXiv:2502.04485v1 类型: cross 摘要: 尽管大型语言模型（LLMs）在各种基准测试中表现令人印象深刻，但在处理现实世界交互中常见的语义含糊问题方面的能力仍然尚未得到充分探索。为了解决这一问题，我们提出了一种任务含糊性的正式定义，并从贝叶斯实验设计的角度重新定义任务去含糊化问题。通过提出澄清性问题，LLM代理可以获取额外的任务规范，逐步缩小可行解的空间，降低生成不满意输出的风险。然而，生成有效的澄清性问题需要LLM代理进行一种形式的元认知推理，而目前LLM可能还缺乏这种能力。我们提出的一种主动任务去含糊化方法使LLM代理能够生成最大化信息增益的目标问题。实际上，这种方法将推理负担从隐含转移到了显式地关于可行解空间的推理。实验证明，这种问题选择形式在任务去含糊化方面比仅在问题空间内进行推理的方法更有效。