LLM2D

摘要

arXiv:2504.02965v1 类型: cross 摘要: 大型语言模型(LLMs)在广泛的语言任务中表现出的卓越能力为人类与AI的合作问题解决开辟了新的机遇。通过在大规模应用中运用人类的直觉和推理策略，LLMs能够放大人类的能力。我们探索了是否可以通过从人类引导AI系统解决复杂语言问题的示范中进行泛化来模拟人类引导者。我们引入了CoLa，一种新颖的自引导学习范式，用于训练自动化**引导者**，并将其评估应用于两个问答数据集、一个解谜任务和一个受限文本生成任务。我们的实验证明，CoLa在所有领域中表现均优于竞争对手。此外，一个较小规模的训练引导者在作为引导者时，在与GPT-4这样强大的模型竞争中表现更优。我们通过对问答数据集进行人类研究，比较了人类和自动化引导者所采用的策略。我们展示了自动化引导者通过调整其策略以适应推理者的能力建模，进行了定性的分析，突出了引导策略中的显著差异。