LLM2D
Home
Arxiv
返回列表
针对目标导向决策的妄想识别与应对
Identifying and Addressing Delusions for Target-Directed Decision-Making
作者:
Mingde Zhao, Tristan Sylvain, Doina Precup, Yoshua Bengio
发布日期:
10/10/2024
arXiv ID:
oai:arXiv.org:2410.07096v1
摘要
我们关注目标导向型智能体,它们在决策时规划过程中会生成目标,以指导其行为并在评估期间实现更好的泛化能力。这些智能体的训练不当会导致妄想:智能体可能会对目标持有错误的信念,无法得到有效纠正,从而导致不良行为和损害分布外泛化能力。我们通过在精心控制的环境中使用直观的示例来识别不同类型的妄想,并调查其原因。我们展示了如何解决通过事后重新标记训练的智能体的妄想问题,事后重新标记是训练目标导向型强化学习智能体的主流方法。我们在实证上验证了所提解决方案在纠正妄想行为和提高分布外泛化能力方面的有效性。
查看原文
下载 PDF