LLM2D

摘要

本文主要目标是解决视觉定位问题，这对于移动机器人的安全导航至关重要。我们提出的解决方案采用全景图像和三元组卷积神经网络。我们试图利用这种架构的特性来解决室内环境中的分层和全局定位问题，这些环境容易出现视觉混叠和其他现象。考虑到这些架构中三元组损失函数的重要性，我们对不同的三元组损失函数进行了全面的比较评估。实验部分证明，可以使用相对较少的在特定光照条件下捕获的图像来训练三元组网络，即使如此，生成的网络仍然是执行动态条件下视觉定位的强大工具。我们的方法已经针对一些影响因素进行了评估，例如光照条件变化、遮挡、噪声和运动模糊。此外，为了探索我们方法的局限性，三元组网络已在不同的室内环境中同时进行了测试。在所有情况下，这些架构都展现了在各种具有挑战性的场景中进行泛化的强大能力。实验中使用的代码可在https://github.com/MarcosAlfaro/TripletNetworksIndoorLocalization.git获取。