LLM2D
PREDICT:通过评估从候选轨迹推断出的分解偏好进行偏好推理
PREDICT: Preference Reasoning by Evaluating Decomposed preferences Inferred from Candidate Trajectories
作者: Stephane Aroca-Ouellette, Natalie Mackraz, Barry-John Theobald, Katherine Metcalf
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.06273v1

摘要

为了创建提供个性化和有效交互的 AI 代理,适应人类偏好至关重要。最近的研究表明,大型语言模型 (LLM) 有潜力从用户交互中推断出偏好,但它们通常会产生宽泛且通用的偏好,无法捕捉到人类偏好的独特性和个性化特征。本文介绍了 PREDICT,这是一种旨在提高推断偏好的精度和适应性的方法。PREDICT 包含三个关键要素:(1) 推断偏好的迭代细化,(2) 将偏好分解为组成部分,以及 (3) 在多个轨迹中验证偏好。我们在两个不同的环境中评估了 PREDICT:网格世界设置和一个新的文本领域环境(PLUME)。PREDICT 更准确地推断出细微的人类偏好,比现有基线提高了 66.2%(网格世界环境)和 41.0%(PLUME)。