摘要
大型语言模型(LLM)如 GPT4 和 Llama2 在摘要、翻译和内容审核等任务中展现出强大的能力。然而,它们的大规模应用引发了担忧,特别是LLM可能大规模传播具有说服力的、类似人类的虚假信息,这可能会严重影响公众舆论。本研究探讨了这些风险,重点关注LLM将虚假信息传播为事实的能力。为了研究这一点,我们构建了LLM回声室,一个模拟社交媒体聊天室的受控数字环境,虚假信息通常在其中传播。回声室,即个人只与志同道合的人互动的地方,会进一步强化信念。通过研究恶意机器人在这个环境中传播虚假信息,我们可以更好地理解这一现象。我们回顾了当前的LLM,探讨了虚假信息的风险,并应用了最先进的微调技术。使用微软phi2模型,用我们自定义的数据集进行微调,我们生成了有害内容来创建回声室。这种设置,由GPT4评估其说服力和危害性,揭示了围绕LLM的伦理问题,并强调了需要加强对虚假信息的防范措施。