LLM2D

摘要

arXiv:2504.03051v1 类型: cross 摘要：从疫苗安全报告等未结构化的临床文本中准确地编码医疗症状是一项关键任务，应用于药物警戒和安全性监测。如本研究中所定制的，症状编码涉及识别并链接细致的症状提及到标准化词汇表（如MedDRA），这与更广泛的医疗编码任务不同。传统方法将症状提取和链接视为独立的工作流，往往难以处理临床叙述的多样性和复杂性，尤其是对于罕见病例。近期大型语言模型（LLMs）的进步带来了新的机会，但也面临着在一致性表现上达到预期的挑战。为解决这些问题，我们提出了一种名为Task as Context (TACO) 提示的新框架，该框架通过将任务特定的背景信息嵌入到LLM提示中，统一了提取和链接任务。我们的研究还引入了SYMPCODER数据集，该数据集源自疫苗不良事件报告系统（VAERS）报告，并提出了一种两阶段评估框架，以全面评估症状链接和提及准确性。我们对多个人工智能语言模型进行全面评估，包括Llama2-chat、Jackalope-7b、GPT-3.5 Turbo、GPT-4 Turbo和GPT-4o，展示了TACO在提升定制任务如症状编码的灵活性和准确性方面的有效性，为更具体的编码任务铺平道路，并推动了临床文本处理方法的发展。