LLM2D

摘要

arXiv:2502.06669v1 类型: 交叉摘要：观察到大型语言模型（LLMs）的零样本能力取得了显著的进步。由于它们对输入的高度敏感性，研究重点越来越多地转向通过直接简单的提示工程来提升LLMs的性能，而不是复杂的领域适应。研究表明，LLMs表现出情感 intelligence，积极和消极情绪都有可能提高任务性能。然而，之前的交互提示主要集中在单一刺激类型上，忽略了不同刺激效果的比较、任务难度变化的影响或潜在机制的探讨。本文受社会认知理论中自我效能与任务性能之间正相关性的启发，引入了口头效能刺激（VES）。我们的VES包含三种类型的口头提示：鼓励性、挑衅性和批评性，涵盖了诸如帮助性和能力等方面。我们还进一步分类任务难度，旨在广泛调查不同类型的VES如何在不同难度级别上影响语言模型的自我效能感和任务成就。实验结果显示，三种类型的VES在大多数任务上都能提高LLMs的性能，最有效的VES因不同模型而异。在广泛的实验中，我们获得了一些与心理理论一致的发现，为未来的研究提供了新的见解。