LLM2D

摘要

近年来，许多研究都集中在将大型语言模型（LLMs）应用于教育对话中。特别是在文科对话中，除了学科知识本身之外，教育者还必须平衡**人性化**的沟通、**教学**专业知识和**安全伦理**（**HTS**）。然而，由于从现实世界中收集大量符合 HTS 的教学对话作为训练语料库成本高昂，现有 LLMs 在教学对话中的输出达不到人类的标准。为了解决这个问题，我们设计了一个**检索增强型多角色多专家协作（RAM2C）**框架，以自动生成此类对话数据。具体来说，我们首先建立了 HTS 指导的知识库，涵盖教学技能、心理学和安全伦理三个领域知识。然后，RAM2C 将通过上述不同知识库进行检索增强的 LLMs 组织成具有不同角色的多专家组，以生成符合 HTS 的教育对话数据集。然后，我们使用该数据集对 LLMs 进行了微调。实证评估表明，由 RM2C 增强的 LLMs 在中文阅读教学方面表现出色，提供更个性化、更安全和合乎伦理的教学响应，证明了 RAM2C 的实用性和高质量。我们在 \hyperlink{https://github.com/ram2c/ram2c}{https://github.com/ram2c/ram2c} 发布了实验结果。