LLM2D

摘要

arXiv:2504.00707v1 Announce Type: cross 摘要：人类可以通过利用现有技能和知识来不断获得新的技能和知识，从而改进学习，同时又不会忘记这些知识。类似地，在机器学习中，“持续学习”旨在在保留先前获得的知识的同时学习新信息。现有研究往往忽略了人类学习的本质，由于人类选择或环境约束，任务通常是交错进行的。因此，人类很少在一个任务完全掌握后才切换到下一个任务。为了探讨人类似的学习能为学习者带来多大程度上的益处，我们提出了一种根据“学习进度”和能量消耗交错任务的方法。从机器学习角度来看，我们的方法可以被视为一种在平衡学习性能和能量约束的同时模仿生态上现实的人类任务学习的多任务学习系统。为了评估我们方法的有效性，我们在仿真环境中考虑了一个机器人学习的设置，其中机器人在不同的环境中学习其行为的效果。进行的实验表明，我们提出的方法在任务学习性能上优于顺序任务学习，并且降低了学习任务时的能量消耗。