摘要
arXiv:2502.13108v1 Announce Type: cross
摘要:临床问题回答(CQA)在医疗决策中扮演着重要角色,使医生能够从电子医疗记录(EMRs)中提取相关信息。虽然基于变换器的模型如BERT、BioBERT和ClinicalBERT在CQA上展示了最先进的性能,但现有的模型缺乏对提取答案进行分类的能力,这对于结构化检索、内容过滤和医疗决策支持至关重要。
为了解决这一局限性,我们引入了一个多任务学习(MTL)框架,该框架同时训练用于回答提取和医疗分类的CQA模型。除了预测答案跨度外,我们的模型还将响应分类为五个标准化的医学类别:诊断、药物、症状、程序和实验室报告。这种分类能够生成更结构化和可解释的输出,使临床QA模型在实际医疗环境中更具用处。
我们在emrQA上评估了我们的方法,emrQA是一个大型的医疗问答数据集。结果显示,与标准微调相比,MTL在F1分数上提高了2.2%,而在答案分类上的准确率达到90.7%。这些发现表明,MTL不仅提高了CQA性能,还引入了一种有效的分类和结构化医学信息检索机制。