LLM2D

摘要

语音深度伪造对个人安全和内容真实性构成重大威胁。文献中已经提出了几种检测器，其中一个主要挑战是这些系统必须面对跨越广泛数据集识别假信号的跨不可见数据的泛化能力。本文提出了一种使用专家混合架构来增强语音深度伪造检测性能的新方法。专家混合框架非常适合语音深度伪造检测任务，因为它能够专门针对不同的输入类型并有效地处理数据可变性。与传统的单一模型或集成方法相比，这种方法具有优越的泛化能力和对不可见数据的适应性。此外，其模块化结构支持可扩展更新，使其在管理不断变化的深度伪造技术的复杂性方面更加灵活，同时保持高检测精度。我们提出了一种高效的轻量级门控机制，为每个输入动态分配专家权重，优化检测性能。跨多个数据集的实验结果证明了我们提出的方法的有效性和潜力。