摘要
arXiv:2412.05342v4 通告类型: replace-cross
摘要:大型语言模型(LLM)通常被微调以参与双向或两方对话,这使其难以适应多方对话(MPD),阻碍了它们在多人会议、讨论和日常交流等场景中的应用。以往基于LLM的研究主要集中在多智能体框架上,而其基础的LLM仍然进行两两微调。在这项工作中,我们设计了一个适用于多方对话数据集的多方微调框架(MuPaS),并证明这样一个简单的框架能够有效地使LLM与多方对话风格保持一致。我们还设计了两种训练策略,可以将MuPaS转换为MPD模拟器。大量实验表明,MuPaS能够实现最先进的多方响应,更高的下一个发言者的预测准确性,更高的人工和自动评价的话语质量,并且即使在出了分布的场景、主题和角色描述下也能生成合理的对话。MuPaS框架将LLM训练与更复杂的多方应用,如对话生成、虚拟彩排或元宇宙联系起来。