LLM2D

摘要

arXiv:2411.06353v2 Announce Type: replace-cross 摘要：部署在开放世界的机器学习模型通常会遇到不熟悉的条件，并在不可预见的情况下表现不佳。随着人工智能系统的发展并在关键安全领域找到应用，处理离分布（OOD）数据的有效性对于构建开放世界学习系统至关重要。在这项工作中，我们引入了ALOE，一种新颖的开放世界环境中的主动学习算法，旨在通过两阶段方法增强模型适应性，从而通过新OOD类增强模型。首先，多样性采样选择一组代表性示例，然后通过能量分布的OOD检测优先标记可能未知的类。这种策略可以在资源受限的注释预算下加速类的发现和学习。在三个长尾图像分类基准上的评估表明，ALOE优于传统的主动学习基准，能够在平衡注释成本的同时扩展已知类别。我们的研究结果揭示了增强已知类别性能与发现新类别之间的重要权衡，为未来的开放世界机器学习进步奠定了基础。