LLM2D

摘要

arXiv:2502.05409v1 宣称类型: 交叉摘要：本文提出了一种用于海洋环境中的无人机视距单目姿态估计的视觉循环仿真环境。最近，一种具有变换器架构的深度神经网络已被成功训练，用于估算无人机相对于研究船甲板的姿态，克服了基于GPS方法的多个限制。然而，在实际海洋环境中验证深度姿态估计方案面临巨大挑战，因为研究船的数量有限且相关操作成本高昂。为了解决这些问题，我们提出了一种基于照片写实的3D虚拟环境，利用最新的高斯散射技术，这是一种通过将3D空间中的图像像素建模为3D空间中的高斯分布来表示3D场景的新技术，可以从多个视角创建轻量级、高质量的视觉模型。该方法允许创建一个结合了现场采集的多张真实世界图像的虚拟环境。由此产生的模拟环境可以在室内测试飞行机动，同时验证飞行软件、硬件以及深度单目姿态估计方案的所有方面。该方法为测试和验证船载无人机的自主飞行提供了一种经济高效的解决方案，特别专注于基于视觉的控制和估计算法。