LLM2D

摘要

arXiv:2412.05342v4 通告类型: replace-cross 摘要：大型语言模型（LLM）通常被微调以参与双向或两方对话，这使其难以适应多方对话（MPD），阻碍了它们在多人会议、讨论和日常交流等场景中的应用。以往基于LLM的研究主要集中在多智能体框架上，而其基础的LLM仍然进行两两微调。在这项工作中，我们设计了一个适用于多方对话数据集的多方微调框架（MuPaS），并证明这样一个简单的框架能够有效地使LLM与多方对话风格保持一致。我们还设计了两种训练策略，可以将MuPaS转换为MPD模拟器。大量实验表明，MuPaS能够实现最先进的多方响应，更高的下一个发言者的预测准确性，更高的人工和自动评价的话语质量，并且即使在出了分布的场景、主题和角色描述下也能生成合理的对话。MuPaS框架将LLM训练与更复杂的多方应用，如对话生成、虚拟彩排或元宇宙联系起来。