摘要
arXiv:2410.09713v3 宣告类型: replace-cross
摘要:自20世纪70年代以来,信息检索(IR)一直被定义为从预定义的语料中获取相关的信息项,以满足用户的信息需求。传统的IR系统虽然在诸如网络搜索的领域有效,但受限于其对静态、预定义信息项的依赖。为了解决这一问题,本文引入了代理信息检索(Agentic IR),这是一种由大型语言模型(LLMs)和AI代理驱动的变革性的下一代IR范式。Agentic IR的核心转变在于从静态、预定义的信息项到动态、情境依赖的信息状态的变化。信息状态指的是用户在动态环境中所处的具体信息情境,不仅包括已获取的信息项,还包括实时的用户偏好、情境因素以及决策过程。通过这种方式,传统的信息检索,专注于基于用户查询获取相关的信息项,可以自然地扩展到根据用户指令实现目标信息状态,从而定义了代理信息检索。本文从任务定义、架构、评估、案例研究以及挑战和未来展望等多个方面系统地讨论了代理信息检索。我们认为,本文介绍的代理信息检索的概念不仅拓宽了信息检索研究的范围,也为更为适应、互动和智能的下一代IR范式奠定了基础。