LLM2D

摘要

arXiv:2502.01789v1 宣告类型: 新摘要: 早期识别认知问题至关重要，但往往受到症状表现细微的限制。本研究开发并验证了一个完全自动化、多代理的人工智能工作流，使用LLaMA 3 8B来识别马萨诸塞州综合医院Brigham部分3,338份临床笔记中的认知问题。利用针对特定任务的代理动态合作，从临床笔记中提取有意义的洞察，该工作流与以专家为主导的基准进行了比较。两个工作流均实现了高水平的分类性能，F1分数分别为0.90和0.91。多代理工作流在特异性方面表现出改进（1.00），并在更少的迭代中实现了即时细化。虽然两个工作流在验证数据上的性能有所降低，但多代理工作流保持了完美的特异性。这些发现凸显了完全自动化的多代理人工智能工作流在更高效率下达到专家级准确性的潜力，为临床环境中检测认知问题提供了可扩展且成本效益高的解决方案。