LLM2D

摘要

大型语言模型（LLM）如 GPT4 和 Llama2 在摘要、翻译和内容审核等任务中展现出强大的能力。然而，它们的大规模应用引发了担忧，特别是LLM可能大规模传播具有说服力的、类似人类的虚假信息，这可能会严重影响公众舆论。本研究探讨了这些风险，重点关注LLM将虚假信息传播为事实的能力。为了研究这一点，我们构建了LLM回声室，一个模拟社交媒体聊天室的受控数字环境，虚假信息通常在其中传播。回声室，即个人只与志同道合的人互动的地方，会进一步强化信念。通过研究恶意机器人在这个环境中传播虚假信息，我们可以更好地理解这一现象。我们回顾了当前的LLM，探讨了虚假信息的风险，并应用了最先进的微调技术。使用微软phi2模型，用我们自定义的数据集进行微调，我们生成了有害内容来创建回声室。这种设置，由GPT4评估其说服力和危害性，揭示了围绕LLM的伦理问题，并强调了需要加强对虚假信息的防范措施。