摘要
arXiv:2503.21615v1 合作类型: 交叉
摘要:成功的代理-人类伙伴关系要求任何生成的信息对人类来说是可理解的,且人类可以轻松地引导代理实现目标。这种有效的沟通要求代理发展出关于哪些内容对人类来说是可理解的更精细的概念。最先进的代理,包括大语言模型(LLMs),缺乏这种详细的可理解性概念,因为它们仅从训练数据中捕捉到人类的平均感受性,因此只能提供有限的可引导性(例如,需要非平凡的提示工程)。
在这篇论文中,我们不是仅仅依赖数据,而是主张开发通用化、领域无关的可理解性度量,这些度量可以作为这些代理的指令。现有的可理解性度量研究是碎片化的,我们对这些领域的各种努力进行了回顾,并为未来更连贯和领域无关的研究调查奠定了认知科学为基础的根基。