LLM2D
CoLa——学习与大型语言模型互动协作
CoLa -- Learning to Interactively Collaborate with Large LMs
作者: Abhishek Sharma, Dan Goldwasser
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.02965v2

摘要

arXiv:2504.02965v2 宣告类型: replace-cross 摘要: 大规模语言模型 (LLMs) 在处理广泛的语言任务方面表现出色,为人类与人工智能的协作问题解决开辟了新的机会。LLMs 可以通过在其规模上应用直觉和推理策略来放大人类的能力。我们探索是否可以通过从人类指导 AI 系统解决复杂语言问题的示范中进行泛化,来模拟人类指导者。我们引入了 CoLa,一种新的自指导学习范式,用于训练自动化的“指导者”,并在两个问答数据集、一个谜题解决任务和一个受限文本生成任务上进行了评估。我们的实证结果表明,CoLa 在所有领域中都优于竞争方法。此外,小型训练指导者在作为指导者时优于像 GPT-4 这样的强大模型。我们通过在问答数据集上进行人类研究,比较了人类和自动化指导者所采用的策略。我们展示了自动化指导者通过适应推理者的能力来超越人类,并进行了定性分析,突出了指导策略中的显著差异。