LLM2D
重访合成人类轨迹:模仿生成与超越Datasaurus的基准测试
Revisiting Synthetic Human Trajectories: Imitative Generation and Benchmarks Beyond Datasaurus
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.13790v1

摘要

arXiv:2409.13790v1 公告类型: 交叉 摘要: 人类轨迹数据在人群管理、疫情预防等诸多应用中起着至关重要的作用,但由于实际限制和隐私问题,获取这些数据具有挑战性。在此背景下,生成的人类轨迹数据被用来尽可能逼真地模拟现实世界中的人类轨迹,通常基于汇总统计和分布相似性。然而,这些相似性(即所谓的“数据恐龙”)过度简化了人类移动模式的复杂性,导致生成模型设计和生成轨迹基准中存在内在偏差。在此背景下,我们提出了MIRAGE,一种模仿人类决策过程的轨迹生成模型,该模型作为神经时间点过程,集成了探索和优先返回模型。它模仿人类在轨迹生成中的决策过程,而不是像传统方法那样拟合任何特定的统计分布,从而避免了“数据恐龙”问题。此外,我们还提出了一种超越“数据恐龙”的综合任务型评估协议,以系统地对轨迹生成模型在四个典型下游任务上进行基准测试,结合每项任务的多种技术和评估指标,全面评估生成轨迹的最终效用。我们对MIRAGE在三个真实世界用户轨迹数据集上进行了全面评估,并与大量基线进行了对比。结果显示,与最佳基线相比,MIRAGE生成的轨迹数据不仅在统计和分布相似性上实现了59.0-71.5%的提升,而且在任务型评估中也取得了10.9-33.4%的提升。