LLM2D
基于 Huber 能量测度的量化
Huber-energy measure quantization
作者: Gabriel Turinici
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2212.08162v3

摘要

我们描述了一种测度量化过程,即一种算法,该算法通过$Q$个狄拉克测度之和($Q$为量化参数)来寻找目标概率律(更一般地,是符号有限变差测度)的最佳近似值。该过程通过最小化原始测度与其量化版本之间的统计距离来实现;该距离由一个负定核构建,并且如果需要,可以在运行时计算并馈送到随机优化算法(例如SGD、Adam等)。我们从理论上研究了最优测度量化器的存在性基本问题,并确定了哪些核属性能够保证合适的行为。我们提出了两个最佳线性无偏估计量(BLUE)来估计平方统计距离,并在一个称为HEMQ的无偏过程中使用它们来寻找最优量化。我们在几个数据库上测试了HEMQ:多维高斯混合、维纳空间cubature、意大利葡萄酒品种和MNIST图像数据库。结果表明,HEMQ算法具有鲁棒性和通用性,并且对于Huber能量核类,其结果与预期的直观行为相符。