摘要
社会文化规范作为社交互动中个人行为的指导原则,强调尊重、合作和适当的行为,这有利于对话信息检索、情境信息检索和检索增强机器学习等任务。我们提出了一种利用大型语言模型(LLMs)构建社会文化规范(SCN)库的可扩展方法,用于实现社会感知对话。我们构建了一个全面且公开可访问的中文社会文化规范库。我们的方法利用社会感知对话,并辅以情境框架,作为主要数据源来约束生成过程并减少幻觉。这使得能够提取高质量和细致入微的自然语言规范语句,利用语句在情境方面的语用含义。由于带有黄金框架的真实对话数据并不容易获得,我们建议使用合成数据。我们的实验结果表明:(i)从合成数据中提取的 SCN 的质量与从带有黄金框架的真实对话中提取的 SCN 的质量相当,以及(ii)从带有银色(预测)或黄金框架的真实数据中提取的 SCN 的质量超过了没有框架注释的 SCN 的质量。我们进一步证明了提取的 SCN 在基于 RAG(检索增强生成)的模型中有效性,以推理多个下游对话任务。