摘要
arXiv:2504.01700v1 交叉通知类型:跨领域
摘要:社会机器人中的个性化对于促进有效的以人为本的交互至关重要,然而系统往往面临冷启动问题,即初始用户偏好或特征不可用。本文提出了一种名为USER-LLM R1的新框架,通过动态用户画像和模型初始化解决了这一挑战。我们的方法将链式思考(CoT)推理模型与多模式输入结合以初始化用户画像,从而实现首次交互即可进行个性化交互。利用检索增强生成(RAG)架构,系统在固有的CoT过程中动态细化用户表示,确保上下文相关和适应性的响应。在ElderlyTech-VQA基准上的评估表明,与最先进的基线相比,在ROUGE-1(+23.2%)、ROUGE-2(+0.6%)和ROUGE-L(+8%)的F1分数上取得了显著改进,消融研究进一步强调了推理模型大小对性能的影响。人类评估进一步验证了该框架的有效性,特别是对于老年用户,个性化响应增强了参与度和信任度。伦理考虑,包括隐私保护和偏见缓解,得到了严格的讨论和解决,以确保负责任的部署。