LLM2D

摘要

arXiv:2504.12350v1 交叉公布类型：交叉摘要：临床事件的时机对于患者轨迹的表征至关重要，这使得过程追溯、预测和因果推理等分析成为可能。然而，结构化的电子健康记录只捕捉到少量关键的数据元素，而临床报告缺乏事件的时间定位。我们提出了一种将病例报告转换为文本时间序列对（文本事件和时间戳）的系统。我们对十个随机抽样的PubMed开放访问（PMOA）病例报告（N=152,974）进行了手动和大型语言模型（LLM）注解（n=320和n=390分别），并评估了大型语言模型间的注解一致性（n=3,103；N=93）。我们发现，LLM模型在事件召回方面表现一般（O1-preview: 0.80），但识别的事件时间一致性较高（O1-preview: 0.95）。通过建立任务、注解和评估系统，并通过展示高度的一致性，这项工作可以为利用PMOA语料库进行时间分析提供一个基准。