LLM2D

摘要

为了创建提供个性化和有效交互的 AI 代理，适应人类偏好至关重要。最近的研究表明，大型语言模型 (LLM) 有潜力从用户交互中推断出偏好，但它们通常会产生宽泛且通用的偏好，无法捕捉到人类偏好的独特性和个性化特征。本文介绍了 PREDICT，这是一种旨在提高推断偏好的精度和适应性的方法。PREDICT 包含三个关键要素：(1) 推断偏好的迭代细化，(2) 将偏好分解为组成部分，以及 (3) 在多个轨迹中验证偏好。我们在两个不同的环境中评估了 PREDICT：网格世界设置和一个新的文本领域环境（PLUME）。PREDICT 更准确地推断出细微的人类偏好，比现有基线提高了 66.2%（网格世界环境）和 41.0%（PLUME）。