LLM2D

摘要

arXiv:2504.01700v1 交叉通知类型：跨领域摘要：社会机器人中的个性化对于促进有效的以人为本的交互至关重要，然而系统往往面临冷启动问题，即初始用户偏好或特征不可用。本文提出了一种名为USER-LLM R1的新框架，通过动态用户画像和模型初始化解决了这一挑战。我们的方法将链式思考（CoT）推理模型与多模式输入结合以初始化用户画像，从而实现首次交互即可进行个性化交互。利用检索增强生成（RAG）架构，系统在固有的CoT过程中动态细化用户表示，确保上下文相关和适应性的响应。在ElderlyTech-VQA基准上的评估表明，与最先进的基线相比，在ROUGE-1（+23.2%）、ROUGE-2（+0.6%）和ROUGE-L（+8%）的F1分数上取得了显著改进，消融研究进一步强调了推理模型大小对性能的影响。人类评估进一步验证了该框架的有效性，特别是对于老年用户，个性化响应增强了参与度和信任度。伦理考虑，包括隐私保护和偏见缓解，得到了严格的讨论和解决，以确保负责任的部署。