LLM2D
使用新型信息检索和人工智能工具可以加速地平线扫描
Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools
作者: Lena Schmidt, Oshin Sharma, Chris Marshall, Sonia Garcia Gonzalez Moral
发布日期: 4/3/2025
arXiv ID: oai:arXiv.org:2504.01627v1

摘要

arXiv:2504.01627v1 项目类型: cross 摘要: 引言:医疗保健领域的地平线扫描评估创新的早期信号,这对于及时采纳至关重要。当前的地平线扫描面临着有效信息检索和分析方面的挑战,尤其是在处理如新闻等非结构化来源时,这需要创新工具。方法:本研究引入了SCANAR和AIDOC,这两个开源的Python工具旨在提高地平线扫描的效率。SCANAR自动化了新闻文章的检索和处理,提供了诸如去重和无监督相关性排序等功能。AIDOC通过利用AI来协助筛选,根据相关性重排文本数据,使用神经网络进行语义相似性计算,并随后优先处理可能相关的内容供人工审核。结果:研究使用了十二个内部地平线扫描数据集和四个外部基准数据集。SCANAR通过自动化依赖手工劳动的过程提高了检索效率。AIDOC展示了节省人工审查工作的潜力,实现了约62%的手动审查工作量减少,同时保持95%的召回率。与基准数据的比较分析表明,AIDOC的性能与现有的系统审查自动化工具相似,但性能会根据数据集特征有所不同。一个小型案例研究显示,在活动学习过程中结合大型语言模型的潜力,可以加速新闻数据集中相关文章的检测。结论:验证表明,SCANAR和AIDOC有可能通过简化数据检索和优先处理来提高地平线扫描的效率。这些工具可以缓解方法论的限制,并允许更广泛、更快地进行地平线扫描。建议进一步研究以优化这些模型,并设计整合大型语言模型的新工作流和验证过程。