LLM2D

摘要

arXiv:2505.09062v1 类型: cross 摘要: 近期的源代码摘要技术利用了基于变换器的预训练模型，包括代码大型语言模型（LLMC），以自动化和提升代码摘要的生成质量。然而，现有的方法往往集中在为给定的源代码生成高质量的单一摘要，忽视了生成的摘要可能不足，而需要备选选项的场景。本文中，我们引入了变分前缀调谐（VPT）这一新颖的方法，增强预训练模型生成多样化且准确的摘要集的能力，使用户能够为给定的源代码选择最合适的摘要。我们的方法将条件变分自编码器（CVAE）框架作为模块化组件集成到预训练模型中，使我们能够建模观测目标摘要的概率分布，并采样连续嵌入作为前缀，以在解码过程中引导生成多样化的输出。重要的是，我们以参数高效的方式构建了该方法，避免了昂贵的模型重新训练的需求，尤其是在使用LLMC时。此外，我们采用一种双标准重新排名方法来选择生成的摘要子集，优化提供给用户的选择的多样性和准确性。我们使用广泛使用的数据集和当前最先进的预训练代码摘要模型进行了详尽的实验评估，以证明我们方法的有效性和其在不同模型上的适应性。