LLM2D

摘要

arXiv:2504.19373v1 Announce Type: cross 摘要：随着具有代理多模态大规模推理能力的模型（如ChatGPT o3）能力的不断增强，通过无意中泄露图像地理位置而导致的隐私泄露问题引起了严重的关注。本文首次系统地开展了关于ChatGPT o3视觉推理能力潜在隐私风险的研究。我们手工收集并构建了一个包含50张包含个人及与隐私相关的环境元素的真实世界图像的数据集，以捕捉现实且敏感的场景进行分析。我们的实验评估表明，ChatGPT o3能够以高精度预测用户位置，在60%的情况下实现了街道级别的准确率（在一英哩以内）。通过对这些图像的分析，我们发现了关键的视觉线索，包括街道布局和前院设计，这些线索显著地影响了模型推断的成功率。此外，定向遮挡实验表明，遮挡关键特征可以有效地降低地理定位精度，为我们提供了潜在防御机制的见解。我们的发现强调了急需对具有代理多模态大规模推理能力的模型进行隐私意识开发的重要性，特别是在涉及私人图像的应用中。