摘要
arXiv:2504.13955v2 公告类型:替换-交叉
摘要:用于心理健康支持的AI系统的进展受限于能访问的心理治疗对话数据有限,特别是在创伤治疗方面。我们提出了创伤一千声,这是一个基于 PTSD(创伤后应激障碍)长期暴露疗法协议的合成基准数据集,包含3000场心理治疗对话。数据集包括500个独特的病例,每个病例通过六种对话视角进行探索,反映了从初始焦虑到最高峰的创伤压力再到情绪处理的心理治疗进程。我们使用确定性和概率生成方法,结合了多元的人口统计学特征(年龄18-80岁,平均年龄49.3岁,男性占49.4%,女性占44.4%,非二元性别占6.2%)、20种创伤类型和10种与创伤相关的行为。分析结果显示了创伤类型和症状的真实分布(目睹暴力10.6%,欺凌10.2%)、(噩梦23.4%,药物滥用20.8%)。临床专家验证了数据集的治疗真实性,指出其情感深度,同时建议进行更多真实性的改进。我们还开发了一个情感轨迹基准,使用标准化的评估指标来衡量模型响应。这个隐私保护的数据集解决了创伤相关心理卫生数据的关键缺口,为推进面向患者的的应用和临床培训工具提供了有价值的资源。