LLM2D
生成式AI时代的信息检索:RGB模型
Information Retrieval in the Age of Generative AI: The RGB Model
作者: Michele Garetto, Alessandro Cornacchia, Franco Galante, Emilio Leonardi, Alessandro Nordio, Alberto Tarable
发布日期: 4/30/2025
arXiv ID: oai:arXiv.org:2504.20610v1

摘要

arXiv:2504.20610v1 Announce Type: cross 摘要:大型语言模型(LLMs)和生成型AI的出现从根本上改变了互联网上的信息检索和处理,带来了内容真实性与可靠性方面的巨大潜力和重要关切。本文提出了一种新颖的定量方法,以揭示随着生成型AI工具使用的增长而产生的复杂信息动态。尽管这些工具对数字生态系统产生了重大影响,但这些动态仍很大程度上未被探索和理解。我们提出了一种随机模型来表征对新主题的生成、索引和传播。这一场景尤其挑战当前的LLMs,这些模型往往依赖于实时检索增强生成(RAG)技术来克服其静态知识的限制。我们的研究发现表明,生成型AI的迅速采用与用户依赖性的增加,可能会超越人工验证的速度,从而加剧数字资源中不准确信息传播的风险。对Stack Exchange数据的深入分析确认,高质量的答案不可避免地需要大量的时间和人力才能出现。这强调了生成针对新问题具有说服力文本时所具有的重大风险,并突显了未来生成型AI工具负责任开发和部署的重要需求。