LLM2D

摘要

arXiv:2505.08818v1 类型: cross 摘要：视觉语言模型（VLM）的开发、适应和应用的复杂性和多面性要求在高风险的医疗环境中建立清晰和标准化的报告规范。由于涉及VLM的研究性质多样，从新的VLM开发到领域对齐的微调，再到针对特定诊断和预测任务的现成使用VLM，定义这些报告标准本身就具有挑战性。在这篇立场声明中，我们认为传统的机器学习报告标准和评估指南需要重新调整，以适应多阶段的VLM研究；同时也需要组织得当，让用户易于理解，同时保持可复制性的严格标准。为促进社区采用，我们提出了VLM研究的分类框架，并概述了相应的报告标准，这些标准全面涵盖了性能评估、数据报告规范以及关于文章编写建议。这些指南是根据提出的分类方案组织的。最后，我们提出了一个检查表，汇集了报告标准，提供了一个标准化工具，以确保VLM相关研究发表的一致性和质量。