摘要
arXiv:2504.09343v1 类型: cross
摘要:本文探讨了生成型人工智能聊天机器人中确认偏见的现象,这是一个相对较少被研究的人工智能-人类互动方面的方面。通过认知心理学和计算语言学,本文探讨了确认偏见(通常被理解为倾向于寻找与现有信念相一致的信息的倾向)如何通过大型语言模型的设计和运行机制被复制和放大。文章分析了确认偏见在聊天机器人互动中可能的表现机制,评估了该偏见相关的伦理和实践风险,并提出了多种缓解策略。这些策略包括技术干预、界面再设计以及旨在促进平衡的人工智能生成性话语的政策措施。文章最后概述了未来的研究方向,强调了跨学科合作和实证评估的必要性,以更好地理解和解决生成型人工智能系统中的确认偏见问题。