arXiv 论文列表

自回归扩散模型的判别器引导

我们在自回归扩散模型的背景下引入了判别器引导。使用判别器来引导扩散过程之前已用于连续扩散模型，而在这项工作中，我们推导了在离散情况下将判别器与预训练生成模型结合使用的方法。首先，我们展示了使用最优判别器将修正预训练模型并实现从基础数据分布中精确采样。其次，考虑到使用次优判别器的现实情况，我们推导出一种顺序蒙特卡罗算法，该算法在生成过程中迭代地考虑判别器的预测。我们在生成分子图的任务上测试了这些方法，并展示了判别器如何在生成性能上优于仅使用预训练模型。

发布时间: 9/24/2024

查看原文

开放-CRB：面向开放世界的3D目标检测主动学习

基于LiDAR的3D物体检测最近通过主动学习（AL）取得了显著进展，通过训练少量策略性选择的点云达到了令人满意的性能。然而，在现实世界的应用中，流媒体点云可能包含未知或新的物体，目前的AL方法捕捉这些物体的能力尚未探索。本文研究了一个更实际且更具挑战性的研究任务：3D物体检测的开放世界主动学习（OWAL-3D），旨在获取包含新概念的有信息点云。为解决这一挑战，我们提出了一种简单但有效的策略，称为开放标签简洁性（OLC），该策略以最低的标注成本挖掘新颖的3D物体。我们的实验证明，OLC仅通过一轮选择就成功地将3D检测模型适应于开放世界场景。任何通用的AL策略都可以与所提出的OLC集成，以有效解决OWAL-3D问题。在此基础上，我们介绍了Open-CRB框架，该框架将OLC与我们初步的AL方法CRB无缝集成，专为3D物体检测设计。我们开发了一个全面的代码库，以便于复现和未来研究，支持15种基准方法（例如，主动学习、分布外检测和开放世界检测），2种现代3D检测器（例如，单阶段SECOND和双阶段PV-RCNN）和3个基准3D数据集（例如，KITTI、nuScenes和Waymo）。大量实验表明，所提出的Open-CRB在识别新类和已知类方面展示了优越性和灵活性，与最先进的基准方法相比，标注成本极低。源代码可在\url{https://github.com/Luoyadan/CRB-active-3Ddet/tree/Open-CRB}获取。

发布时间: 9/24/2024

查看原文

自适应多头对比学习

在对比学习中，通过不同增强方法生成的原始图像的两个视图被视为一个正样本对，并要求它们的相似性要高。同样，不同图像的两个视图形成一个负样本对，且鼓励它们的相似性要低。通常情况下，由单一投影头提供的单一相似性度量用来评估正负样本对的相似性。然而，由于多样化的增强策略和不同的样本内部相似性，同一图像的视图可能并不总是相似。此外，由于样本之间的相似性，不同图像的视图可能比同一图像的视图更相似。因此，强制正样本对具有高相似性和负样本对具有低相似性可能无法实现，在某些情况下，这种强制可能会对性能产生不利影响。为了解决这一挑战，我们提出使用多个投影头，每个投影头生成一组不同的特征。我们的预训练损失函数源于对给定观测样本的正样本头部后验分布的最大似然估计的解决方案。该损失结合了对正负样本对的相似性度量，每个度量由单独的自适应温度重新加权，以防止不良解决方案。我们的方法，自适应多头对比学习（AMCL），可以应用于并在实验中增强几种流行的对比学习方法，如SimCLR、MoCo和Barlow Twins。无论在各种骨干网络和线性探测时期，改进都保持一致，并且在使用多种增强方法时变得更加显著。

发布时间: 9/24/2024

查看原文

生成蜜罐中的大语言模型

蜜罐是网络安全中用于早期检测、威胁情报收集和分析攻击者行为的重要工具。然而，大多数蜜罐缺乏足够的真实性，无法长时间吸引和欺骗人类攻击者。容易被识别的蜜罐严重削弱了其有效性，这可能是因为它们过于确定性、缺乏适应性或深度。本研究介绍了基于大型语言模型的动态和现实的软件蜜罐 shelLM，它生成类 Linux 的 shell 输出。我们使用基于云的 LLM 设计和实现了 shelLM，并评估了 shelLM 是否能够生成与真实 Linux shell 预期输出一致的结果。评估通过让网络安全研究人员使用蜜罐并反馈每个答案是否是 Linux shell 预期的结果来进行。结果表明，shelLM 能够生成可信且动态的回答，能够解决当前蜜罐的局限性。shelLM 达到了 0.90 的 TNR，成功欺骗了人类，使其认为与真实的 Linux shell 一致。用于复现实验的源代码和提示已公开。

发布时间: 9/24/2024

查看原文

ChatEDA：一个由大型语言模型驱动的EDA自主代理

通过集成一套复杂的电子设计自动化（EDA）工具来增强互操作性是电路设计师面临的一个关键问题。最近在大语言模型（LLM）方面的进展展示了其在自然语言处理和理解方面的卓越能力，提供了一种与EDA工具交互的新方法。本研究论文介绍了ChatEDA，一个由LLM AutoMage驱动、并由EDA工具作为执行者的自主EDA代理。ChatEDA通过有效管理任务分解、脚本生成和任务执行，简化了从寄存器传输级（RTL）到图形数据系统版本II（GDSII）的设计流程。通过全面的实验评估，ChatEDA展示了其处理多种需求的能力，而我们经过微调的AutoMage模型在性能上优于GPT-4和其他类似的LLM。

发布时间: 9/24/2024

查看原文

视觉变换器在联邦学习中的持续适应

在这篇论文中，我们关注一个重要但尚未充分研究的问题——持续联邦学习（CFL），其中服务器与一组客户端通信，以在不共享或存储任何数据的情况下逐步学习新概念。由于持续学习和联邦学习的双重挑战，这一问题的复杂性进一步增加。具体来说，在CFL设置中训练的模型遭受灾难性遗忘，并且由于客户端之间的数据异质性，这种情况更加严重。现有对这一问题的尝试往往会对客户端和通信通道施加大量开销，或者需要访问存储的数据，这使得它们由于隐私原因不适用于现实世界的应用。在本文中，我们尝试在最小化开销的同时解决遗忘和异质性问题，并且不需要访问任何存储的数据。我们在视觉变换器的背景下研究这个问题，并探索参数高效的方法来适应动态分布，同时最小化遗忘。我们通过利用一种基于提示的方法（这样只需要传递提示和分类器头）并提出一种新颖且轻量级的生成和蒸馏方案来巩固服务器上的客户端模型来实现这一目标。我们将这个问题形式化为图像分类问题，并建立强大的基准进行比较，在CIFAR-100以及像ImageNet-R和DomainNet这样具有挑战性的、大规模数据集上进行实验。我们的方法在减少通信和客户端计算成本的同时，性能超越了现有方法和我们自己的基准多达7%。代码可在https://github.com/shaunak27/hepco-fed获取。

发布时间: 9/24/2024

查看原文

生物医学自然语言处理中的大型语言模型：基准、基线和建议

生物医学文献正在迅速增长，手动整理和提取知识变得具有挑战性。能够自动从生物医学文献中提取信息的生物医学自然语言处理（BioNLP）技术有助于减轻这一负担。最近，大型语言模型（LLMs），如GPT-3和GPT-4，由于其卓越的性能而获得了广泛关注。然而，它们在BioNLP任务中的有效性以及对方法开发和下游用户的影响仍未得到充分研究。本初步研究（1）在八个BioNLP数据集中建立了GPT-3和GPT-4在零样本和单样本设置下的基线性能，涵盖四个应用：命名实体识别、关系抽取、多标签文档分类以及语义相似性和推理，（2）检查了LLMs产生的错误，并将错误分类为三种类型：遗漏、不一致和不必要的人工内容，（3）提供了在BioNLP应用中使用LLMs的建议。我们通过https://github.com/qingyu-qc/gpt_bionlp_benchmark公开提供数据集、基线和结果。

发布时间: 9/24/2024

查看原文

无需真实世界3D监督的手中物体3D重建

先前用于从单幅图像重建手持物体的工作是在配有3D形状的图像上训练模型。这种数据在现实世界中大规模收集具有挑战性。因此，当面对野外环境中的新颖物体时，这些方法的泛化效果不佳。虽然3D监督是一个主要瓶颈，但有大量的a)展示手-物体交互的野外原始视频数据和b)合成的3D形状集合。在本文中，我们提出了利用这些来源的3D监督来扩大学习手持物体重建模型的模块。具体而言，我们从视频中提取多视图2D掩码监督，并从形状集合中提取3D形状先验。我们使用这些间接的3D线索来训练占用网络，以预测从单一RGB图像中物体的3D形状。我们在具有挑战性的物体泛化设置中的野外MOW数据集上的实验显示，与在现有数据集上使用3D监督训练的模型相比，相对改进了11.6%。

发布时间: 9/24/2024

查看原文

多智能体MDP下基于概率性智能体失效的无模型学习与最优策略设计

本文研究了可能发生代理丢失的多智能体马尔可夫决策过程（MDP），以及基于丢失前系统的控制和采样计算丢失后系统的策略。中央规划者的目标是找到一个最优策略，在预先知道代理丢失概率的情况下最大化预期系统的价值。对于具有某种转移独立性和奖励可分离结构的MDP，我们假设从系统中移除代理会形成一个由剩余代理组成的新MDP，其状态和动作空间、转移动态都忽略了移除的代理，并且奖励与移除的代理无关。我们首先表明，在这些假设下，预期丢失后系统的价值可以用单一的MDP表示；这种"鲁棒MDP"消除了评估系统所有$2^N$种实现的需要，其中N表示代理数量。更重要的是，在无模型的情况下，表明鲁棒MDP的价值可以通过丢失前系统生成的样本估计，这意味着可以在丢失发生前找到鲁棒策略。这一事实被用来提出一种策略重要性采样（IS）程序，该程序在控制现有系统的同时对丢失场景进行策略评估。策略IS程序生成鲁棒MDP和具体丢失后系统实现的价值估计，并通过指数置信区间进行验证。最后，通过仿真验证了这种方法的实用性，展示了代理丢失的结构特性如何帮助控制器在丢失发生前找到好的丢失后策略。

发布时间: 9/24/2024

查看原文

单轨迹分布鲁棒强化学习

为减轻经典强化学习（RL）框架严重依赖相同训练和测试环境的限制，提出了分布鲁棒性强化学习（DRRL），以增强在各种环境中的性能，可能包括未知的测试环境。作为获得鲁棒性的代价，DRRL涉及对一组分布进行优化，这本质上比在非鲁棒情况下对固定分布进行优化更具挑战性。现有的DRRL算法要么是基于模型的，要么无法从单一样本轨迹中学习。在本文中，我们设计了第一个完全无模型的DRRL算法，称为具有单轨迹的分布鲁棒Q学习（DRQ）。我们精心设计了一个多时间尺度框架，以充分利用每个逐步到来的样本，直接学习最优的分布鲁棒策略而无需建模环境，因此该算法可以在无模型的情况下沿着单个轨迹进行训练。尽管算法复杂，我们通过推广经典随机逼近工具提供了渐近收敛性保证。综合实验结果表明，与非鲁棒方法和其他鲁棒RL算法相比，我们提出的算法在鲁棒性和样本复杂度上具有显著优势。

发布时间: 9/24/2024

查看原文