LLM2D

摘要

arXiv:2409.05202v2 宣布类型: replace-cross 摘要: 随着深度神经网络在过去的十年中取得了令人兴奋的突破，数据增强在大规模标注数据不可用时已成为正则化技术中备受关注的方法。在现有的增强方法中，Mixup 及其相关数据混合方法因其通过生成数据依赖的虚拟数据同时容易迁移到各种领域而广泛采用，从而获得高性能。本文综述提供了对基础 Mixup 方法及其应用的全面回顾。我们首先以统一框架的形式详述了包含模块的增强训练管道，该框架可以包含各种 Mixup 方法并提供直观的操作流程。然后，我们系统地研究了 Mixup 增强在计算机视觉下游任务、各种数据模态以及 Mixup 的一些分析与定理方面的应用。同时，我们总结了 Mixup 研究的现状和局限性，并指出了有效和高效的 Mixup 增强的进一步工作。本文综述可以为研究人员提供 Mixup 方法的现状，并在 Mixup 领域提供一些见解和指导作用。与此综述相关的在线项目可在 https://github.com/Westlake-AI/Awesome-Mixup。