LLM2D

摘要

arXiv:2504.21800v2 宣告类型: replace-cross 摘要：合成数据在医疗保健领域的日益采用是由隐私顾虑、真实世界数据有限的访问以及注解成本高昂所驱动的。本文探讨了使用合成延长暴露（PE）治疗对话作为 PTSD 临床模型训练和评估的可扩展替代方案。我们系统地比较了真实和合成对话，使用语言学、结构和协议特定的指标，包括轮流模式和治疗忠诚度。我们还引入并评估了源自语言分析和语义建模的 PE 特定指标，提供了一个超越表面流畅性的临床忠诚度评估的新框架。我们的研究成果表明，尽管合成数据有潜力缓解数据稀缺并保护患者隐私，但它在捕捉治疗互动中的微妙动态方面可能会遇到困难。合成疗法对话在结构特征上与真实世界对话紧密匹配（例如，说话人切换比率：0.98 对比 0.99）；然而，它们可能无法充分反映关键的忠诚度标记（例如，压力监控）。我们指出了现有评估框架中的差距，并倡导一种超越表面流畅性的忠诚度感知度量，以发现重要的临床失败。我们的发现阐明了合成数据在补充真实世界数据集中的有效领域——以及存在的关键限制。