LLM2D
CoLa -- 学习与大型语言模型互动协作
CoLa -- Learning to Interactively Collaborate with Large LMs
作者: Abhishek Sharma, Dan Goldwasser
发布日期: 4/7/2025
arXiv ID: oai:arXiv.org:2504.02965v1

摘要

arXiv:2504.02965v1 类型: cross 摘要: 大型语言模型(LLMs)在广泛的语言任务中表现出的卓越能力为人类与AI的合作问题解决开辟了新的机遇。通过在大规模应用中运用人类的直觉和推理策略,LLMs能够放大人类的能力。我们探索了是否可以通过从人类引导AI系统解决复杂语言问题的示范中进行泛化来模拟人类引导者。我们引入了CoLa,一种新颖的自引导学习范式,用于训练自动化**引导者**,并将其评估应用于两个问答数据集、一个解谜任务和一个受限文本生成任务。我们的实验证明,CoLa在所有领域中表现均优于竞争对手。此外,一个较小规模的训练引导者在作为引导者时,在与GPT-4这样强大的模型竞争中表现更优。我们通过对问答数据集进行人类研究,比较了人类和自动化引导者所采用的策略。我们展示了自动化引导者通过调整其策略以适应推理者的能力建模,进行了定性的分析,突出了引导策略中的显著差异。