摘要
arXiv:2410.03974v2 宣告类型: replace-cross
摘要:从多个源聚集数据可以形式化为最优运输(Optimal Transport, OT)巴里辛尼中心问题,该问题旨在基于OT差异计算概率分布的平均值。然而,在现实场景中,数据测量中的离群值和噪声的存在显著妨碍了传统统计方法在估计OT巴里辛尼中心方面的性能。为了解决这一问题,我们提出了一种基于(半-)不平衡OT问题的对偶形式的新型可扩展方法,用于估算稳健的连续巴里辛尼中心。据我们所知,这是首次尝试在连续分布设置下开发稳健巴里辛尼中心算法的方法。我们的方法被构架为一个最小-最大优化问题,并且可以适应一般成本函数。我们严格建立所提方法的理论基础,并通过一系列示例实验展示了其对离群值和类别不平衡的鲁棒性。我们的源代码可在 https://github.com/milenagazdieva/U-NOTBarycenters 公开获取。