摘要
近年来,许多研究都集中在将大型语言模型(LLMs)应用于教育对话中。特别是在文科对话中,除了学科知识本身之外,教育者还必须平衡**人性化**的沟通、**教学**专业知识和**安全伦理**(**HTS**)。然而,由于从现实世界中收集大量符合 HTS 的教学对话作为训练语料库成本高昂,现有 LLMs 在教学对话中的输出达不到人类的标准。为了解决这个问题,我们设计了一个**检索增强型多角色多专家协作(RAM2C)**框架,以自动生成此类对话数据。具体来说,我们首先建立了 HTS 指导的知识库,涵盖教学技能、心理学和安全伦理三个领域知识。然后,RAM2C 将通过上述不同知识库进行检索增强的 LLMs 组织成具有不同角色的多专家组,以生成符合 HTS 的教育对话数据集。然后,我们使用该数据集对 LLMs 进行了微调。实证评估表明,由 RM2C 增强的 LLMs 在中文阅读教学方面表现出色,提供更个性化、更安全和合乎伦理的教学响应,证明了 RAM2C 的实用性和高质量。我们在 \hyperlink{https://github.com/ram2c/ram2c}{https://github.com/ram2c/ram2c} 发布了实验结果。