LLM2D

摘要

arXiv:2504.13146v1 宣告类型: 新摘要: 前沿模型生成扩展推理轨迹时无意中产生了丰富的token序列，这些序列可以促进模型蒸馏。认识到这一漏洞，模型所有者可能会寻求一些采样策略，这些策略可以限制蒸馏的有效性，而不损害模型的性能。\emph{反蒸馏采样}提供了这种能力。通过战略性地修改模型的下一个token概率分布，反蒸馏采样污染了推理轨迹，使其在蒸馏方面的有效性显著降低，同时保持模型的实际用途。有关更多信息，请参见 https://antidistillation.com。