LLM2D
通过言语效能刺激提升大型语言模型的自我效能感和性能
Boosting Self-Efficacy and Performance of Large Language Models via Verbal Efficacy Stimulations
作者: Rui Chen, Tailai Peng, Xinran Xie, Dekun Lin, Zhe Cui, Zheng Chen
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.06669v1

摘要

arXiv:2502.06669v1 类型: 交叉 摘要:观察到大型语言模型(LLMs)的零样本能力取得了显著的进步。由于它们对输入的高度敏感性,研究重点越来越多地转向通过直接简单的提示工程来提升LLMs的性能,而不是复杂的领域适应。研究表明,LLMs表现出情感 intelligence,积极和消极情绪都有可能提高任务性能。然而,之前的交互提示主要集中在单一刺激类型上,忽略了不同刺激效果的比较、任务难度变化的影响或潜在机制的探讨。本文受社会认知理论中自我效能与任务性能之间正相关性的启发,引入了口头效能刺激(VES)。我们的VES包含三种类型的口头提示:鼓励性、挑衅性和批评性,涵盖了诸如帮助性和能力等方面。我们还进一步分类任务难度,旨在广泛调查不同类型的VES如何在不同难度级别上影响语言模型的自我效能感和任务成就。实验结果显示,三种类型的VES在大多数任务上都能提高LLMs的性能,最有效的VES因不同模型而异。在广泛的实验中,我们获得了一些与心理理论一致的发现,为未来的研究提供了新的见解。