LLM2D
$\alpha$-交替器:使用Vendi得分在序列中动态适应变化的噪音水平以提高稳定性和性能
The $\alpha$-Alternator: Dynamic Adaptation To Varying Noise Levels In Sequences Using The Vendi Score For Improved Robustness and Performance
作者: Mohammad Reza Rezaei, Adji Bousso Dieng
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2502.04593v1

摘要

arXiv:2502.04593v1 类型: cross 摘要:当前最先进的动力模型,如Mamba,假设给定序列中的所有元素具有相同的噪声水平,这限制了其在嘈杂的时间数据上的性能。在本文中,我们介绍了$\alpha$-Alternator,这是一种新型的时间依赖数据生成模型,可以根据序列中变化的噪声水平动态调整其复杂性。$\alpha$-Alternator利用Vendi评分(VS),这是一种灵活的基于相似性的多样性度量,每一步$t$,根据VS调整时间$t$处序列元素及其迄今为止的动力学的潜在表示对预测未来动力学的影响。这种影响由一个参数捕获,该参数在给定数据集中的所有序列中学习并共享。该参数的符号决定了影响的方向。当该参数为负值时,表示数据集嘈杂,序列元素中增加VS的部分被视为噪声,模型在处理该元素时更多地依赖潜在历史。相反,当参数为正值时,增加VS的序列元素被视为有用的信息,$\alpha$-Alternator在更新其预测潜在动力学时更多依赖这种新输入而非潜在历史。$\alpha$-Alternator通过观测蒙版和Alternator损失最小化相结合的方式进行训练。蒙版模拟了序列中的变化噪声水平,使得模型更能承受这些波动并提高了轨迹预测、插补和预测方面的性能。我们的实验结果表明,在神经解码和时间序列预测基准测试中,$\alpha$-Alternator在两者上都优于Alternator和最先进的状态空间模型。