LLM2D

摘要

大型语言模型驱动的智能体在解决复杂任务方面展现出非凡的能力。然而，大多数智能体系统仍然是被动的，这限制了它们在需要预见性和自主决策的场景中的有效性。本文致力于开发能够预测并启动任务，无需明确的人工指令的主动型智能体。我们为此提出了一种新颖的数据驱动方法。首先，我们收集真实世界的人类活动来生成主动任务预测。然后，这些预测由人工标注者标记为接受或拒绝。标记后的数据用于训练奖励模型，该模型模拟人类判断，并作为对大型语言模型智能体主动性的自动评估器。在此基础上，我们开发了一个全面的数据生成流程，创建了一个多样化的数据集 ProactiveBench，包含 6790 个事件。最后，我们证明了使用提出的 ProactiveBench 微调模型可以显著激发大型语言模型智能体的主动性。实验结果表明，我们微调后的模型在主动提供帮助方面达到了 66.47% 的 F1 分数，优于所有开源和闭源模型。这些结果突出了我们的方法在创建更主动和有效的智能体系统方面的潜力，为未来人机协作的进步铺平了道路。