LLM2D

摘要

arXiv:2504.09343v1 类型: cross 摘要：本文探讨了生成型人工智能聊天机器人中确认偏见的现象，这是一个相对较少被研究的人工智能-人类互动方面的方面。通过认知心理学和计算语言学，本文探讨了确认偏见（通常被理解为倾向于寻找与现有信念相一致的信息的倾向）如何通过大型语言模型的设计和运行机制被复制和放大。文章分析了确认偏见在聊天机器人互动中可能的表现机制，评估了该偏见相关的伦理和实践风险，并提出了多种缓解策略。这些策略包括技术干预、界面再设计以及旨在促进平衡的人工智能生成性话语的政策措施。文章最后概述了未来的研究方向，强调了跨学科合作和实证评估的必要性，以更好地理解和解决生成型人工智能系统中的确认偏见问题。