摘要
arXiv:2504.12350v1 交叉公布类型:交叉
摘要:临床事件的时机对于患者轨迹的表征至关重要,这使得过程追溯、预测和因果推理等分析成为可能。然而,结构化的电子健康记录只捕捉到少量关键的数据元素,而临床报告缺乏事件的时间定位。我们提出了一种将病例报告转换为文本时间序列对(文本事件和时间戳)的系统。我们对十个随机抽样的PubMed开放访问(PMOA)病例报告(N=152,974)进行了手动和大型语言模型(LLM)注解(n=320和n=390分别),并评估了大型语言模型间的注解一致性(n=3,103;N=93)。我们发现,LLM模型在事件召回方面表现一般(O1-preview: 0.80),但识别的事件时间一致性较高(O1-preview: 0.95)。通过建立任务、注解和评估系统,并通过展示高度的一致性,这项工作可以为利用PMOA语料库进行时间分析提供一个基准。