arXiv 论文列表

作者: Jiaqi Zhao, Ming Wang, Miao Zhang, Yuzhang Shang, Xuebo Liu, Yaowei Wang, Min Zhang, Liqiang Nie

arXiv:2502.13178v1 交叉类型公告摘要：后训练量化(PTQ)技术由于其高效性和低资源需求，已经被广泛应用于大型语言模型(LLL)的压缩。然而，现有研究缺乏对每种PTQ策略的优越性和适用场景的深入分析。此外，现有的算法主要关注性能，而忽略了模型大小、性能和量化位宽之间的权衡。为了解决这些困惑，我们在本文中提供了一种新的LLMs PTQ基准。首先，为了支持我们的基准，我们通过仔细审查现有主流方法的计算策略（例如，基于优化的方法、补偿基的方法等），提出了一种全面的分类法。然后，我们在每个类别中使用基线进行广泛的实验，涵盖了各种规模的模型（7B-70B）、位宽、训练级别（LLaMA1/2/3/3.1）、架构（Mixtral、DeepSeekMoE、Mamba）和模态（LLaVA1.5和VILA1.5），以及广泛的评估指标。通过对实验结果的对比分析，我们总结了每种PTQ策略的优势及模型大小与量化位宽之间的权衡考虑性能情况。例如，我们的基准表明，基于补偿的技术在跨架构鲁棒性方面表现出色，并且对于超大规模模型的极低位宽量化应重新审视。最后，我们进一步提出，一个实用的补偿和其他PTQ策略的组合可以实现最先进的鲁棒性。我们相信，我们的基准将为LLMs的部署和未来PTQ方法的研究提供有价值的建议。

发布时间: 2/20/2025

查看原文

通过扰动进行直接偏好优化的KL惩罚控制

作者: Sangkyu Lee, Janghoon Han, Hosung Song, Stanley Jungkyu Choi, Honglak Lee, Youngjae Yu

arXiv:2502.13177v1 宣布类型: cross 摘要: 直接偏好优化(Direct Preference Optimization, DPO)展示了仅使用离线数据将大型语言模型与人类偏好对齐的优势。然而，DPO 的一个局限性在于，用于防止过度偏离参考模型的 KL 惩罚项在整个训练过程中是静态的。尽管有几种方法尝试将这个静态的 KL 惩罚项变为动态的，但没有一种方法能够根据不同偏好对自适应地分配不同的 KL 惩罚项。在本文中，我们提出了 ε-Direct Preference Optimization (ε-DPO)，它允许对每个偏好对的 KL 惩罚强度 β 进行自适应控制。具体而言，ε-DPO 通过在训练过程中简单地重用当前策略和参考策略的 logit，并基于扰动 β 时 logit 的单调性，对每个偏好对自适应地控制 β。实验结果表明，ε-DPO 在通用聊天机器人的基准测试中优于现有的直接对齐算法和 KL 惩罚放松方法，强调了在 DPO 中实例级自适应 KL 惩罚放松的重要性。

发布时间: 2/20/2025

查看原文

BaKlaVa — 预算化的KV缓存分配以支持长上下文推理

作者: Ahmed Burak Gulhan, Krishna Teja Chitty-Venkata, Murali Emani, Mahmut Kandemir, Venkatram Vishwanath

arXiv:2502.13176v1 跨域公告类型：交叉摘要：在大型语言模型（LLM）推理中，键值（KV）缓存（KV-caches）对于降低时间复杂度至关重要。然而，随着上下文长度的增长，它们会导致GPU内存呈线性增长。虽然最近的工作探索了KV-cache的驱逐和压缩策略以减少内存使用，但它们经常考虑所有注意力头的统一KV-cache，导致性能不佳。我们提出了BaKlaVa方法，该方法通过估计每个KV-cache的重要性来为模型中的每个单独的KV-cache分配最优内存。我们的实证分析表明，并非所有KV-cache对LLM性能都同样关键。通过一次性剖析方法，BaKlaVa为每个KV-cache分配了最优内存预算。我们在LLaMA-3-8B和Qwen2.5-7B模型上评估了该方法，在保持基线性能的同时，在较低压缩级别实现了高达70%的压缩率，并在较高压缩水平下提供了数量级的准确度改进。

发布时间: 2/20/2025

查看原文

面向鲁棒性和安全性的体化AI：脆弱性和攻击综述

作者: Wenpeng Xing, Minghao Li, Mohan Li, Meng Han

arXiv:2502.13175v1 类别:交叉摘要：具身AI系统，包括机器人和自主车辆，越来越多地被集成到实际应用中，它们在遇到来自环境和系统层面因素的一系列漏洞时面临着严峻挑战。这些漏洞通过传感器欺骗、 adversarial 攻击和任务与运动规划失败等形式表现出来，对系统的鲁棒性和安全性构成了重大挑战。尽管相关研究逐渐增多，但现有的综述研究很少专门关注具身AI系统独特的安全和安全挑战。大多数先前的工作要么关注一般AI的漏洞，要么专注于孤立的方面，缺乏一个专门且统一的框架来针对具身AI。本文通过以下方式填补了这一关键空白：(1) 将具身AI特有的漏洞分为外生因素（如物理攻击、网络安全威胁）和内生因素（如传感器故障、软件缺陷）；(2) 系统地分析具身AI特有的 adversarial 攻击模式，重点关注它们对感知、决策和具身交互的影响；(3) 研究针对具身系统中的大型视觉语言模型（LVLM）和大型语言模型（LLM）的攻击途径，如 jailbreak 攻击和指令误解；(4) 评估算法在具身感知、决策和任务规划中的健全部署挑战；以及(5) 提出针对性策略以增强具身AI系统的安全性和可靠性。通过整合这些维度，我们提供了一个全面框架，以理解具身AI中漏洞与安全之间的相互作用。

发布时间: 2/20/2025

查看原文

生成拓扑优化：在结构设计中探索多样化的解决方案

作者: Andreas Radler, Eric Volkmann, Johannes Brandstetter, Arturs Berzins

arXiv:2502.13174v1 宣告类型: cross 摘要: 结构优化（TO）是一类从形式化问题描述中推导出近最优几何形状的计算方法。尽管这些方法取得了成功，但现有的TO方法只能生成单一的解决方案，限制了对替代设计的探索。为了解决这一限制，我们引入了一种无需数据的方法——生成型结构优化（GenTO）——该方法通过显式多样化约束训练了一个神经网络，以生成结构上符合要求的形状并探索多样化的解决方案。该网络以求解器在环的方式进行训练，在每一轮迭代中优化材料分布。训练好的模型能够生成多样化的形状，且能够紧密符合设计要求。我们在2D和3D TO问题上验证了GenTO。实验结果表明，GenTO能够比任何先前的方法生成更多的多样化解决方案，同时保持接近最优性，并且由于固有的并行性，速度快了几个数量级。这些发现为工程和设计开辟了新的途径，提供了在结构优化中增强的灵活性和创新性。

发布时间: 2/20/2025

查看原文

思考偏好优化

作者: Wang Yang, Hongye Jin, Jingfeng Yang, Vipin Chaudhary, Xiaotian Han

arXiv:2502.13173v1 交叉领域类型公告摘要：监督微调（SFT）已成为通过使用大型LLM的长链式推理（CoT）响应来增强相对较小的LLM的长链式推理的有效方法。为了不断改善推理能力，我们可以收集新的高质量长CoT推理SFT数据，或者重复训练现有的SFT数据集。然而，获取新的长CoT SFT数据成本高昂且受限，而重复训练往往会导致性能平台或下降。为了进一步利用SFT数据提升性能，我们提出了思考偏好优化（ThinkPO），这是一种简单而有效的后SFT方法，可在不需新长CoT响应的情况下增强长CoT推理。相反，ThinkPO 利用现成的或易于获取的短CoT推理响应作为被拒绝的答案，以及长CoT响应作为相同问题的选择答案。然后，应用直接偏好优化以鼓励模型偏好更长的推理输出。实验表明，ThinkPO 进一步提高了SFT模型的推理性能，例如将SFT模型的数学推理准确性提高了8.6%，并将推理输出长度提高了25.9%。值得注意的是，ThinkPO 能够不断提升公开精馏SFT模型的性能，例如将官方DeepSeek-R1-Distill-Qwen-7B在MATH500上的性能从87.4%提高到91.2%。

发布时间: 2/20/2025

查看原文

揭示大语言模型代理记忆中的隐私风险

作者: Bo Wang, Weiyi He, Pengfei He, Shenglai Zeng, Zhen Xiang, Yue Xing, Jiliang Tang

arXiv:2502.13172v1 宣告类型: cross 摘要：大规模语言模型（LLM）代理在各种实际应用中越来越普遍。它们通过将私有用户-代理交互存储在记忆模块中以供演示，从而增强决策过程，但这也为LLM代理引入了新的隐私风险。在本文中，我们系统地研究了在黑盒设置下，我们提出的记忆提取攻击（MEXTRA）对LLM代理的脆弱性。为了从记忆中提取私有信息，我们提出了一种有效的攻击提示设计方法，并基于对LLM代理不同水平的知识提出了自动化的提示生成方法。在两个代表性的代理上的实验表明了MEXTRA的有效性。此外，我们从代理方和攻击方的视角探讨了记忆泄漏的关键因素。我们的研究结果突显了在LLM代理设计和部署中迫切需要有效的记忆保护措施。

发布时间: 2/20/2025

查看原文

Web钓鱼网（WPN）：一种用于实时钓鱼活动检测的可扩展机器学习方法

作者: Muhammad Fahad Zia, Sri Harish Kalidass

arXiv:2502.13171v1 类别: cross 摘要: 钓鱼攻击是当今最常见的网络攻击类型，被公认为导致重大数据泄露事件的主要来源，对个人和企业都产生了重大影响。基于Web的钓鱼攻击最为频繁，其攻击向量包括社交媒体帖子和包含指向钓鱼网址的链接的电子邮件，一旦点击这些链接，便会使宿主系统面临更严重的攻击。检测钓鱼网址的研究努力已经涉及使用监督学习技术，这些技术需要大量数据来训练模型，并具有高计算要求。它们还涉及到从电子邮件内容中提取的特征分析，影响用户隐私。此外，它们在面对威胁演变时缺乏弹性，尤其是在生成AI技术出现后，这些技术能够绕过这些系统，如AI生成的钓鱼网址。过去，无监督方法如聚类技术也用于钓鱼检测，但有时由于使用成对比较而不具备可扩展性。它们在检测钓鱼活动时缺乏较高的检测率。在本文中，我们提出了一种无监督学习方法，不仅快速而且可扩展，因为它不涉及成对比较。该方法能够一次性检测整个活动，并保持较高的检测率，同时保护用户隐私；这包括最近由恶意实体使用生成AI技术创建的定向钓鱼网址的活动提升。

发布时间: 2/20/2025

查看原文

SmartLLM：使用自定义生成AI的智能合约审计

作者: Jun Kevin, Pujianto Yugopuspito

arXiv:2502.13167v1 安布告类型: 交叉摘要: 智能合约是去中心化金融(DeFi)和区块链生态系统的核心，但由于编码错误和复杂的攻击向量，它们正日益面临漏洞利用的风险。传统的静态分析工具和现有的漏洞检测方法往往未能全面解决这些挑战，导致高水平的误报率和无法检测动态漏洞。本文介绍了SmartLLM，这是一种利用微调的LLaMA 3.1模型与检索增强生成(RAG)相结合的新颖方法，以提高智能合约审计的准确性和效率。通过整合来自ERC标准的领域专业知识，并采用诸如QLoRA等高效微调技术，SmartLLM 在性能上优于像Mythril和Slither这样的静态分析工具，以及像GPT-3.5和GPT-4这样的零样本大语言模型（LLM）提示方法。实验结果表明召回率达到了100%，准确率达到70%，突显了模型在识别漏洞（包括重入和访问控制问题）方面的鲁棒性。这项研究通过提供可扩展且有效的审计解决方案，推动了智能合约安全性的提升，支持去中心化应用的安全采用。

发布时间: 2/20/2025

查看原文

大型语言模型可以有助于缓解 barren plateaus 问题

作者: Jun Zhuang, Chaowen Guan

arXiv:2502.13166v1 交叉公告类型：cross 摘要：在嘈杂的中等规模量子（NISQ）计算时代，量子神经网络（QNNs）已成为各种应用的有前途的方法，但其训练往往因梯度方差随着模型大小增加而指数级消失的荒谬 plateau (BP) 受阻。为了解决这一挑战，我们提出了一种新的由大语言模型（LLM）驱动的搜索框架 AdaInit，该框架迭代地搜索 QNNs 的最优初始参数以最大化梯度方差，从而减轻 BP。与传统的单次初始化方法不同，AdaInit 使用具有自适应提示的 LLM 动态细化 QNN 的初始化。期望改进（EI）的理论分析证明了搜索的上界，确保该过程最终可以识别出 QNN 的最优初始参数。在四个公开数据集上的广泛实验表明，与经典初始化方法相比，AdaInit 显著提高了 QNN 的可训练性，验证了其在减轻 BP 方面的有效性。

发布时间: 2/20/2025

查看原文