摘要
arXiv:2504.20113v1 Announce Type: new
摘要:科学文献的指数增长加剧了高效证据综合的需求,推动了由自然语言处理和机器学习驱动的自动化元分析(AMA)领域的兴起。这篇基于2006年至2024年筛查的978篇论文并分析了54项跨不同领域的研究的PRISMA系统评价,介绍了一个结构化的框架来评估AMA的现状。研究发现,AMA的主要焦点集中在自动化数据处理上(57%),例如提取和统计建模,只有17%的研究涵盖高级综合阶段。只有2%(一项研究)探讨了初步的全流程自动化,突显了AMA在全面综合方面的关键缺口。尽管大型语言模型(LLMs)和先进AI的近期突破在集成到统计建模和高层次综合方面(如异质性评估和偏差评价)仍处于不发达阶段,这限制了AMA实现完全自主元分析的潜力。基于涵盖医学(67%)和非医学(33%)应用的数据集,我们发现AMA在提升效率、扩展性和再现性方面的具体实施模式和效果存在差异。虽然自动化增强了特定的元分析任务,但实现无缝的端到端自动化仍然是一个开放的挑战。随着AI系统在推理和情境理解方面的发展,填补这些缺口现在变得至关重要。未来的工作必须致力于跨越所有元分析阶段的自动化,改进解释性,并确保方法论的稳健性,以充分发挥AMA在扩展、领域无关的综合方面的潜力。