摘要
arXiv:2504.13955v1 类别: cross
摘要:用于心理健康支持的人工智能系统的发展受到治疗性对话数据有限访问的阻碍,特别是在创伤治疗方面。我们提出了千声创伤,一个基于 PTSD(创伤后应激障碍)持续暴露疗法协议的合成基准数据集,共包含3000个治疗对话。数据集包括500个独特的案例,每个案例通过六种对话视角来探讨治疗过程中从最初焦虑到高峰痛苦再到情感处理的不同阶段。我们使用确定性和概率生成方法,涵盖了多元的人口统计学特征(年龄18-80岁,平均年龄49.3岁,男49.4%,女44.4%,非二元性别占比6.2%),20种创伤类型,以及10种与创伤相关的行为。分析结果显示创伤类型的现实分布(目睹暴力10.6%,欺凌10.2%)和症状(噩梦23.4%,药物滥用20.8%)。临床专家验证了数据集在治疗方面的信效度,强调了其情感深度,同时也提出了使数据更具真实性的改进建议。我们还开发了一个情感轨迹基准,其中包含标准化的评估指标来评估模型响应。这个保护隐私的数据集填补了创伤治疗心理健康数据的关键缺口,为推进患者面向的应用和临床训练工具提供了宝贵的资源。