LLM2D

摘要

arXiv:2404.12917v3 更换交叉摘要：视觉强化学习是一种流行而强大的框架，充分利用了深度学习的突破。已知输入域的变化（例如，由于季节变化导致的不同全景颜色）或任务域的变化（例如，改变汽车的目标速度）会干扰智能体的表现，这需要对每个变化进行新的训练。近年来，在表示学习领域的进展展示了将来自不同神经网络的组件以零样本的方式组合成新模型的可能性。在本文中，我们构建了相对表示框架，该框架将编码器嵌入映射到一个通用空间。我们将这个框架应用到视觉强化学习设置中，允许组合智能体组件以创建能够有效处理未在训练期间遇到的新视觉任务对的新智能体。我们的研究结果突显了模型复用的潜力，显著减少了重新训练的需求，从而大大减少了所需的时间和计算资源。