arXiv 论文列表

作者: Libo Wang

arXiv:2501.14846v2 通识类型: replace-cross 摘要: 鉴于当前大型语言模型在跨对话共享内存方面的差距，本研究提出了一种wormhole记忆模块（WMM），以实现可以在不同对话之间任意检索的记忆方式，犹如魔方。通过仿真实验，研究者基于Python环境构建了一个实验框架，并通过设置记忆障碍来模拟当前大型语言模型（LLMs）之间对话记忆难以共享的情况。将CoQA开发数据集导入实验中，并验证了WMM的非线性索引和动态检索功能在跨对话记忆检索方面的可行性。还对WMM的能力与Titans和MemGPT记忆模块的特性进行了比较分析。实验结果显示，WMM在八次实验中展现了跨对话检索记忆的能力和量化指标的稳定性。该研究为LLMs的内存管理优化提供了新的技术方法，并为未来的实际应用提供了经验。

发布时间: 2/18/2025

查看原文

如何缓解大型语言模型微调中的灾难性遗忘？分层层wise和元素wise正则化

作者: Shezheng Song, Hao Xu, Jun Ma, Shasha Li, Long Peng, Qian Wan, Xiaodong Liu, Jie Yu

arXiv:2501.13669v2 宣告类型: 替换交叉摘要：大型语言模型（LLMs）表现出强大的通用语言能力。然而，将这些模型针对特定领域的任务进行微调往往会导致灾难性遗忘现象，即模型会覆盖或丢失预训练期间获得的基本知识。这种现象极大地限制了LLMs的广泛应用。为了解决这一挑战，我们提出了一种新的方法，用于计算在微调过程中对于保持通用知识至关重要的模型参数的逐元素重要性。该方法采用了一种双重目标优化策略：（1）基于逐元素参数重要性的正则化损失，该损失限制了对于通用知识至关重要的参数的更新；（2）交叉熵损失，使其能够适应特定领域的任务。此外，我们引入了逐层系数来考虑不同层的不同贡献，动态平衡双重目标优化。使用GPT-J和LLaMA-3在科学、医学和物理任务上的广泛实验表明，我们的方法减轻了灾难性遗忘现象，同时增强了模型的适应性。与先前的方法相比，我们的解决方案大约快20倍，并且仅需要10-15%的存储空间，突显了其实用性。该代码将被发布。

发布时间: 2/18/2025

查看原文

偏好课程：LLMs 应该总是先在其偏爱的数据上进行预训练

作者: Xuemiao Zhang, Liangyu Xu, Feiyu Duan, Yongwei Zhou, Sirui Wang, Rongxiang Weng, Jingang Wang, Xunliang Cai

arXiv:2501.13126v2 宣布类型: 更换交叉引用摘要：大型语言模型（LLMs）通常在整个预训练过程中使用一致的数据分布。然而，随着模型能力的提升，直观上讲，其数据偏好会动态变化，表明在不同训练阶段使用不同的数据进行预训练的需求。为实现这一目标，我们提出了基于困惑度差异（PD）的偏好课程学习（PDPC）框架，该框架始终感知并利用LLMs偏好的数据来训练和提升它们。首先，我们引入了PD度量来量化样本对弱模型与强模型的挑战程度差异。具有高PD值的样本对弱模型来说更加具有挑战性，更适合安排在预训练的后期阶段。其次，我们提出了偏好函数来近似预测LLMs在任何训练步骤的数据偏好，以便离线完成数据集的排列，确保训练不间断。在1.3B和3B模型上的实验结果表明，PDPC显著优于基线模型。值得注意的是，使用1T个token训练的3B模型在MMLU和CMMLU上的平均准确率提高了超过8.1%。

发布时间: 2/18/2025

查看原文

背后的笑容：用Happy Ending故事欺骗LLMs

作者: Xurui Song, Zhixin Xie, Shuo Huai, Jiayi Kong, Jun Luo

arXiv:2501.13115v2 安全公告类型: 替换-跨模型摘要：大型语言模型（LLMs）的广泛采用引起了对“jailbreak”攻击的关注，这些攻击通过优化或手动设计 Crafting 恶意提示来利用LLMs生成恶意内容。然而，基于优化的攻击效率和迁移性有限，而现有的手动设计要么容易被检测到，要么需要复杂的与LLMs交互。在本文中，我们首先提供了一个关于“jailbreak”攻击的新视角：LLMs对积极提示更为敏感。基于这一观点，我们部署了Happy Ending Attack（HEA），通过在涉及主要通过“happy ending”形成的积极提示的场景模板中封装恶意请求，从而使LLMs在即刻或后续恶意请求中“jailbreak”。这使得HEA既高效又有效，因为它只需要最多两轮即可完全“jailbreak”LLMs。广泛的实验表明，我们的HEA能够成功地在包括GPT-4o、Llama3-70b、Gemini-pro在内的最先进的LLMs上实施，平均攻击成功率达到了88.79%。我们还提供了HEA成功的原因的定量解释。

发布时间: 2/18/2025

查看原文

基于随机变量对标记大语言模型的benchmarking

作者: Zijin Hong, Hao Wu, Su Dong, Junnan Dong, Yilin Xiao, Yujing Zhang, Zhu Wang, Feiran Huang, Linyi Li, Hongxia Yang, Xiao Huang

arXiv:2501.11790v2 评估类型: 替换-交叉摘要: 近期的研究对当前的数学基准的可靠性提出了担忧，指出了诸如设计简单以及潜在数据污染等问题。因此，创建一个可靠且能有效评估大型语言模型（LLMs）在数学推理方面真实能力的基准仍然是一项重要的挑战。为了解决这个问题，我们提出了RV-Bench框架，该框架通过随机变量在数学推理方面的基准评估LLMs。具体而言，随机变量问题（RV问题）的背景内容与现有基准中的原始问题相类似，但变量组合是随机化的，使得LLMs无法“看到”这些问题。模型必须完全理解原始问题的题型，才能正确回答带有各种变量值的RV问题。因此，LLMs在RV-Bench上的准确性和鲁棒性反映了其在数学推理方面的真正能力。我们在超过30个代表性LLMs上进行了超过1000个RV问题的广泛实验。我们的研究结果表明，LLMs在遇到和“未见过”的数据领域之间表现出技能上的不平衡。对于类似数学推理任务的技能泛化受限于准确性和鲁棒性，但仍然可以通过在测试时进行缩放来得到提升。

发布时间: 2/18/2025

查看原文

异常检测中扩散模型综述

作者: Jing Liu, Zhenchao Ma, Zepu Wang, Chenxuanyin Zou, Jiayang Ren, Zehua Wang, Liang Song, Bo Hu, Yang Liu, Victor C. M. Leung

arXiv:2501.11430v4 公告类型: replace-cross 摘要：扩散模型(DMs)已经成为一种强大的生成人工智能模型类别，显示出在各种领域（如网络安全、欺诈检测、医疗保健和制造业）的异常检测(AD)任务中的显著潜力。将这两个领域相结合的技术被称为扩散模型用于异常检测(DMAD)，为识别日益复杂和高维数据中的偏差提供了有希望的解决方案。在这篇综述中，我们回顾了DMAD研究的最新进展。我们首先介绍AD和DM的基本概念，然后对经典的DM架构，包括DDPMs、DDIMs和Score SDEs进行全面分析。我们进一步将现有的DMAD方法分类为重建基于的、密度基于的和混合方法，并提供了对它们方法论创新的详细探讨。我们还探讨了不同数据模态下的各种任务，包括图像、时间序列、视频和多模态数据分析。此外，我们讨论了关键挑战和新兴的研究方向，包括计算效率、模型可解释性、鲁棒性增强、边缘云协作以及与大型语言模型的整合。DMAD研究论文和资源的集合可在https://github.com/fdjingliu/DMAD找到。

发布时间: 2/18/2025

查看原文

我们该如何构建一个基准？重新审视274个与代码相关的基准测试用于LLMs

作者: Jialun Cao, Yuk-Kit Chan, Zixuan Ling, Wenxuan Wang, Shuqing Li, Mingwei Liu, Ruixi Qiao, Yuting Han, Chaozheng Wang, Boxi Yu, Pinjia He, Shuai Wang, Zibin Zheng, Michael R. Lyu, Shing-Chi Cheung

arXiv:2501.10711v3 宣告类型: replace-cross 摘要：已经提出了各种基准来评估大型语言模型（LLMs）在不同编程场景下的性能。我们称之为代码相关的基准。然而，目前尚没有系统性的指导方针，以确保这些基准的质量、可靠性和可重现性。我们提出了 How2Bench，这是一个由55项标准组成的检查表，旨在全面指导代码相关基准的开发。使用 HOW2BENCH，我们对过去十年内发布的274个基准进行了剖析，发现了一些令人担忧的问题。近70%的基准未能采取数据质量保障措施；超过10%的基准甚至没有开源或仅部分开源。许多高度引用来的基准存在漏洞，包括重复样本、错误的参考代码/测试/提示，以及未清除的敏感/保密信息。最后，我们进行了一项涉及49名参与者的调查研究，揭示了在数据质量、可重现性和透明度方面存在显著差距。

发布时间: 2/18/2025

查看原文

iTool：通过迭代强化 fine-tuning 提升大型语言模型的工具使用能力

作者: Yirong Zeng, Xiao Ding, Yuxian Wang, Weiwen Liu, Wu Ning, Yutai Hou, Xu Huang, Bing Qin, Ting Liu

arXiv:2501.09766v2 公告类型：替换-交叉摘要：通过外部工具增强大型语言模型（LLMs）已知是一种增强其能力的方法，尤其是在复杂任务方面。通过现实世界的模拟合成工具使用数据是一种有效的方法。然而，我们的调查表明，（1）随着合成数据的增加，训练收益显著下降。模型难以从更多合成数据中受益，这主要是由于数据多样性问题，导致在复杂场景中的性能较差。此外，我们发现（2）这一挑战主要表现为模型输出与真实响应之间的微小差异（称为不足），比如需要从上下文进行复杂推理才能解决的参数值错误。为此，我们提出了一种迭代强化微调策略，旨在缓解这些挑战。该策略包括：（1）通过蒙特卡洛树搜索路径探索来增强合成数据的多样性。（2）迭代识别与不足相关的数据，构建精细粒度的偏好对以定位不足，然后应用偏好优化来优化这些不足。我们的实验结果显示，使用我们方法训练的模型在性能上比相同规模的模型高出约3%，优于更大规模的开源和闭源模型。

发布时间: 2/18/2025

查看原文

AI 导盲犬：智能手机上的第一人称路径预测

作者: Aishwarya Jadhav, Jeffery Cao, Abhishree Shetty, Urvashi Priyam Kumar, Aditi Sharma, Ben Sukboontip, Jayant Sravan Tamarapalli, Jingyi Zhang, Anirudh Koul

arXiv:2501.07957v2 通知类型: 替换交叉摘要：本文介绍了AI导盲犬（AIGD），这是一种为视障用户提供轻量级第一人称导航系统，旨在实时部署在智能手机上。AIGD采用基于视觉的多标签分类方法来预测方向命令，确保在不同环境中的安全导航。我们引入了一种结合GPS信号和高级方向的新技术，用于基于目标的室外导航，并且还能处理目的地未知的室内导航的多路径预测不确定性。作为首款能够处理室内和室外环境中的目标导向导航和探索性导航的导航辅助系统，AIGD建立了盲人导航的新基准。我们介绍了方法、数据集、评估和部署见解，以促进导航辅助系统的进一步创新。

发布时间: 2/18/2025

查看原文

实时验证和细化语言模型文本生成

作者: Joonho Ko, Jinheon Baek, Sung Ju Hwang

arXiv:2501.07824v2 宣告类型: replace-cross 摘要：大规模语言模型（LLMs）在各种自然语言任务中表现出色。然而，一个关键挑战在于它们有时会生成事实性错误的答案。为了解决这个问题，尽管许多先前的工作集中在识别它们生成中的错误并进一步对其进行完善，但它们在部署时相对较慢，因为它们的设计是在LLMs完成整个生成过程（从第一个到最后一个词元）之后才验证响应。进一步地，我们观察到，一旦LLMs在早期生成错误的词元，后续词元也更有可能是事实性错误。为此，在本文中，我们提出了一种称为Streaming-VR（流式验证和完善）的新方法，旨在增强LLMs输出验证和完善的效率。具体而言，所提出的Streaming-VR能够在生成过程中实时验证和修正词元，类似于流式处理过程，确保每一组生成的词元都在LLMs构建其响应的过程中由另一个LLM实时检查和修正。通过在多个数据集上的全面评估，我们展示了我们的方法不仅提高了LLMs的事实准确性，而且还提供了与先前的完善方法相比更高效的解决方案。

发布时间: 2/18/2025

查看原文