LLM2D

摘要

arXiv:2405.04118v2 宣告类型: replace-cross 摘要：现代人工智能系统如自动驾驶汽车和游戏代理已经在超人的性能上取得进展，但在人性化的一般化、可解释性以及与人类用户的人机交互方面往往存在不足。受人类语言与决策丰富互动的启发，我们介绍了一种语言瓶颈下的策略学习框架（Policy Learning with a Language Bottleneck, PLLB），该框架使AI代理能够生成描述奖励行为背后的高层策略的语言规则。PLLB 交替进行一个由语言模型引导的*规则生成*步骤和一个由规则引导的*更新*步骤，即使一个规则不足以描述整个复杂的策略也是如此。在包括两人博弈信号游戏、迷宫导航、图像重建和机器人抓取规划在内的五个不同任务中，我们展示了 PLLB 代理不仅能学习更加可解释和普遍适用的行为，还能将学到的规则分享给人类用户，从而促进更有效的人类-人工智能协同工作。我们在 https://github.com/meghabyte/bottleneck 提供了实验的源代码。