LLM2D

摘要

arXiv:2505.02722v1 信息类型: 新摘要：尽管大型语言模型（LLMs）在通用领域展示出了令人印象深刻的推理能力，但其在实际临床实践中的有效性仍受到限制。这很可能是由于在训练过程中其对真实世界临床数据的曝光不足，因为出于隐私问题的考虑，通常不会包含此类数据。为解决这一问题，我们提出通过利用真实世界临床数据来增强LLMs的临床推理能力。我们从全国性脓毒症登记数据中构建了推理密集型问题，并使用强化学习对Phi-4进行微调，结果得到了C-Reason。C-Reason在特定领域的测试集上展示了强大的临床推理能力，这一点通过定量指标和专家评估得到了证实。此外，其增强的推理能力还扩展到了涉及不同任务和患者群的脓毒症数据集、抗生素使用开放性咨询任务以及其他疾病。未来的研究应关注使用大规模、多疾病的临床数据集来训练LLMs，以开发出更加强大且通用的临床推理模型。