LLM2D

摘要

arXiv:2504.02965v2 宣告类型: replace-cross 摘要: 大规模语言模型 (LLMs) 在处理广泛的语言任务方面表现出色，为人类与人工智能的协作问题解决开辟了新的机会。LLMs 可以通过在其规模上应用直觉和推理策略来放大人类的能力。我们探索是否可以通过从人类指导 AI 系统解决复杂语言问题的示范中进行泛化，来模拟人类指导者。我们引入了 CoLa，一种新的自指导学习范式，用于训练自动化的“指导者”，并在两个问答数据集、一个谜题解决任务和一个受限文本生成任务上进行了评估。我们的实证结果表明，CoLa 在所有领域中都优于竞争方法。此外，小型训练指导者在作为指导者时优于像 GPT-4 这样的强大模型。我们通过在问答数据集上进行人类研究，比较了人类和自动化指导者所采用的策略。我们展示了自动化指导者通过适应推理者的能力来超越人类，并进行了定性分析，突出了指导策略中的显著差异。