摘要
arXiv:2408.13918v4 公告类型: 替换
摘要: 生成现实的人类移动数据对于交通、城市规划和传染病控制等各个应用领域至关重要,但由于真实数据因成本高和隐私问题对研究人员而言通常不可获取,现有的深度生成模型通过学习真实轨迹来生成合成轨迹。尽管取得了进展,但大多数方法仍存在训练稳定性问题,并且随着数据量的增加扩展能力较差。更重要的是,它们往往缺乏控制机制,在受特定访问限制等约束的情况下指导生成的轨迹。为解决这些限制,我们正式定义了一个受控轨迹生成问题,以有效处理多种时空约束。我们引入了Geo-Llama,这是一种新颖的LLM微调框架,可以在生成的轨迹中强制执行多个显式访问约束,同时保持生成轨迹的上下文连贯性。在该方法中,预训练的LLM在具有访问权序列置换策略的轨迹数据上进行微调,其中每次访问对应特定时间和地点。这种策略使得模型能够在忽略访问顺序的情况下捕捉时空模式,并通过生成过程中的提示实现灵活且上下文相关的约束集成。在真实世界和合成数据集上的广泛实验验证了Geo-Llama的有效性,证明了它在处理广泛范围的约束方面具备灵活性和鲁棒性,相较于现有方法能够生成更加现实的轨迹。