LLM2D

摘要

arXiv:2407.12393v5 人型化类型：替换-交叉摘要：大型语言模型（LLMs）表现出类似人类的智能，使它们能够模拟人类行为，并支持需要人性化交流和广泛知识储备的各种应用。人们通过特殊训练数据或手工艺品令模型具有人格化特性，但相应地也面临着数据使用不足或行为模式僵化的挑战。因此，人格化的大规模语言模型无法捕捉到人格化的知识或表达持续的意见。为了充分释放大规模语言模型人格化潜力，我们提出了PersLLM，这是一种更好地构建数据和模型微调的框架。对于数据使用不足的问题，我们引入了诸如逻辑推理提示和反归纳等策略，改善了数据构建的质量，更全面地捕捉了人物体验、知识和思想。对于僵化的行为模式，我们设计了调优过程，并引入自动化的DPO，以增强模型人格的特定性和动态性，从而实现更自然的意见交流。自动化的评价指标和专家人工评估都证明了我们方法的有效性。在人机交互和多智能体系统中的案例研究进一步表明了大规模语言模型人格化在潜在应用场景和未来发展方向上的应用前景。