摘要
arXiv:2502.09687v1 类型: cross
摘要:小心你所祈求的,你可能会得到它。这句话适用于大型语言模型(LLMs)的训练方式,这些模型越来越多地被奖励以取悦接收者,而不是仅仅因为正确。因此,它们越来越擅长说服我们他们的答案是有价值的。但它们在说服过程中使用了哪些技巧呢?在本研究中,我们研究了十二种不同语言模型的回答中所使用的心理语言学特征。通过根据理性和情感提示对回答内容进行分组,并探索LLMs所采用的社会影响原则,我们探讨了我们能否以及如何通过减轻LLM驱动的大规模错误信息的风险。我们将本研究置于更广泛的以人为本的人工智能讨论框架内,强调需要跨学科的方法来减轻具有说服力的人工智能回答所带来的认知和社交风险。