LLM2D

摘要

arXiv:2504.20610v1 Announce Type: cross 摘要：大型语言模型（LLMs）和生成型AI的出现从根本上改变了互联网上的信息检索和处理，带来了内容真实性与可靠性方面的巨大潜力和重要关切。本文提出了一种新颖的定量方法，以揭示随着生成型AI工具使用的增长而产生的复杂信息动态。尽管这些工具对数字生态系统产生了重大影响，但这些动态仍很大程度上未被探索和理解。我们提出了一种随机模型来表征对新主题的生成、索引和传播。这一场景尤其挑战当前的LLMs，这些模型往往依赖于实时检索增强生成（RAG）技术来克服其静态知识的限制。我们的研究发现表明，生成型AI的迅速采用与用户依赖性的增加，可能会超越人工验证的速度，从而加剧数字资源中不准确信息传播的风险。对Stack Exchange数据的深入分析确认，高质量的答案不可避免地需要大量的时间和人力才能出现。这强调了生成针对新问题具有说服力文本时所具有的重大风险，并突显了未来生成型AI工具负责任开发和部署的重要需求。