摘要
arXiv:2504.21800v2 宣告类型: replace-cross
摘要:合成数据在医疗保健领域的日益采用是由隐私顾虑、真实世界数据有限的访问以及注解成本高昂所驱动的。本文探讨了使用合成延长暴露(PE)治疗对话作为 PTSD 临床模型训练和评估的可扩展替代方案。我们系统地比较了真实和合成对话,使用语言学、结构和协议特定的指标,包括轮流模式和治疗忠诚度。我们还引入并评估了源自语言分析和语义建模的 PE 特定指标,提供了一个超越表面流畅性的临床忠诚度评估的新框架。我们的研究成果表明,尽管合成数据有潜力缓解数据稀缺并保护患者隐私,但它在捕捉治疗互动中的微妙动态方面可能会遇到困难。合成疗法对话在结构特征上与真实世界对话紧密匹配(例如,说话人切换比率:0.98 对比 0.99);然而,它们可能无法充分反映关键的忠诚度标记(例如,压力监控)。我们指出了现有评估框架中的差距,并倡导一种超越表面流畅性的忠诚度感知度量,以发现重要的临床失败。我们的发现阐明了合成数据在补充真实世界数据集中的有效领域——以及存在的关键限制。