LLM2D

摘要

arXiv:2408.13918v4 公告类型: 替换摘要: 生成现实的人类移动数据对于交通、城市规划和传染病控制等各个应用领域至关重要，但由于真实数据因成本高和隐私问题对研究人员而言通常不可获取，现有的深度生成模型通过学习真实轨迹来生成合成轨迹。尽管取得了进展，但大多数方法仍存在训练稳定性问题，并且随着数据量的增加扩展能力较差。更重要的是，它们往往缺乏控制机制，在受特定访问限制等约束的情况下指导生成的轨迹。为解决这些限制，我们正式定义了一个受控轨迹生成问题，以有效处理多种时空约束。我们引入了Geo-Llama，这是一种新颖的LLM微调框架，可以在生成的轨迹中强制执行多个显式访问约束，同时保持生成轨迹的上下文连贯性。在该方法中，预训练的LLM在具有访问权序列置换策略的轨迹数据上进行微调，其中每次访问对应特定时间和地点。这种策略使得模型能够在忽略访问顺序的情况下捕捉时空模式，并通过生成过程中的提示实现灵活且上下文相关的约束集成。在真实世界和合成数据集上的广泛实验验证了Geo-Llama的有效性，证明了它在处理广泛范围的约束方面具备灵活性和鲁棒性，相较于现有方法能够生成更加现实的轨迹。