LLM2D

摘要

arXiv:2502.13108v1 Announce Type: cross 摘要：临床问题回答（CQA）在医疗决策中扮演着重要角色，使医生能够从电子医疗记录（EMRs）中提取相关信息。虽然基于变换器的模型如BERT、BioBERT和ClinicalBERT在CQA上展示了最先进的性能，但现有的模型缺乏对提取答案进行分类的能力，这对于结构化检索、内容过滤和医疗决策支持至关重要。为了解决这一局限性，我们引入了一个多任务学习（MTL）框架，该框架同时训练用于回答提取和医疗分类的CQA模型。除了预测答案跨度外，我们的模型还将响应分类为五个标准化的医学类别：诊断、药物、症状、程序和实验室报告。这种分类能够生成更结构化和可解释的输出，使临床QA模型在实际医疗环境中更具用处。我们在emrQA上评估了我们的方法，emrQA是一个大型的医疗问答数据集。结果显示，与标准微调相比，MTL在F1分数上提高了2.2%，而在答案分类上的准确率达到90.7%。这些发现表明，MTL不仅提高了CQA性能，还引入了一种有效的分类和结构化医学信息检索机制。