LLM2D
自动元提示工程以实现理论心智对齐
Automated Meta Prompt Engineering for Alignment with the Theory of Mind
作者: Aaron Baughman, Rahul Agarwal, Eduardo Morales, Gozde Akay
发布日期: 5/15/2025
arXiv ID: oai:arXiv.org:2505.09024v1

摘要

arXiv:2505.09024v1 通知类型: 新 摘要: 我们介绍了一种元提示方法,该方法在生成复杂任务流畅文本的同时,优化了人类心理预期与大型语言模型(LLM)神经处理之间的相似性。应用了一种代理强化学习技术,其中作为裁判的LLM (LLMaaJ) 通过上下文学习教另一款LLM如何通过解释预期和非预期生成文本的特点来生成内容。为了衡量人们对内容生成的心理信念,在2024年美国网球公开赛大满贯赛事中,用户在发布前修改了长篇AI生成的文章。现在,LLMaaJ 可以通过预测和在文本生成中包含人类编辑来解决心智理论(ToM)对齐问题。通过实验和解读实时生产系统的结果,人类内容审核者的期望有53.8%的时间与AI对齐,平均迭代次数为4.38。内容特质(如事实性、新颖性、重复性和相关性)的空间几何解释结合了空间体积(所有特质的重要性)和顶点对齐(个别特质的相关性),使LLMaaJ 能够优化人类的心智理论。这导致了网球事件覆盖范围的扩展,提高了内容质量。在2024年美国网球公开赛中部署的此项工作已在体育和娱乐行业的其他实时活动中得到应用。