LLM2D

摘要

arXiv:2504.20113v1 Announce Type: new 摘要：科学文献的指数增长加剧了高效证据综合的需求，推动了由自然语言处理和机器学习驱动的自动化元分析（AMA）领域的兴起。这篇基于2006年至2024年筛查的978篇论文并分析了54项跨不同领域的研究的PRISMA系统评价，介绍了一个结构化的框架来评估AMA的现状。研究发现，AMA的主要焦点集中在自动化数据处理上（57%），例如提取和统计建模，只有17%的研究涵盖高级综合阶段。只有2%（一项研究）探讨了初步的全流程自动化，突显了AMA在全面综合方面的关键缺口。尽管大型语言模型（LLMs）和先进AI的近期突破在集成到统计建模和高层次综合方面（如异质性评估和偏差评价）仍处于不发达阶段，这限制了AMA实现完全自主元分析的潜力。基于涵盖医学（67%）和非医学（33%）应用的数据集，我们发现AMA在提升效率、扩展性和再现性方面的具体实施模式和效果存在差异。虽然自动化增强了特定的元分析任务，但实现无缝的端到端自动化仍然是一个开放的挑战。随着AI系统在推理和情境理解方面的发展，填补这些缺口现在变得至关重要。未来的工作必须致力于跨越所有元分析阶段的自动化，改进解释性，并确保方法论的稳健性，以充分发挥AMA在扩展、领域无关的综合方面的潜力。