arXiv 论文列表

作者: Sigmund H. H{\o}eg, Yilun Du, Olav Egeland

扩散模型在机器人模仿学习中得到了快速应用，使自主执行复杂的灵巧任务成为可能。然而，动作合成通常很慢，需要许多步骤的迭代去噪，限制了模型在需要快速反应策略的任务中的应用范围。为了解决这个问题，最近的一些工作探索了如何利用扩散过程的蒸馏来加速策略合成。然而，蒸馏计算量大，会损害合成动作的准确性和多样性。我们提出了一种名为 SDP（流式扩散策略）的替代方法来加速策略合成，该方法利用了这样的见解：生成部分去噪的动作轨迹比生成完整的输出动作轨迹快得多。在每次观察时，我们的方法输出一个部分去噪的动作轨迹，其噪声污染程度可变，其中要执行的立即动作是无噪声的，后续动作具有越来越高的噪声和不确定性。对于新观察的部分去噪动作轨迹可以通过对先前预测的噪声动作轨迹（向前滚动一个时间步长）进行几步去噪来快速生成。我们在模拟和真实世界环境中都证明了这种方法的有效性，它显著地加快了策略合成速度，同时保持了性能。

发布时间: 10/14/2024

查看原文

FREA：基于可行性引导的安全性临界场景生成，兼顾合理对抗性

作者: Keyu Chen, Yuheng Lei, Hao Cheng, Haoran Wu, Wenchao Sun, Sifa Zheng

大型语言模型 (LLM) 已经在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别 (NER) 中，现有的基于 LLM 的方法...

发布时间: 10/14/2024

查看原文

高效的系统性综述：基于Transformer和迁移学习的文献过滤

作者: John Hawkins, David Tivey

在不断增长的学术研究成果中识别出关键研究是进行高质量研究的内在方面。循证医学中使用的系统综述流程将此形式化为研究计划中必须遵循的程序。然而，它带来了越来越大的负担，因为需要花费大量时间来识别特定主题的重要研究文章。在这项工作中，我们开发了一种方法来构建一个通用过滤系统，该系统将以自然语言描述所需内容形式提出的研究问题与通过应用广泛搜索词获得的候选文章集进行匹配。我们的结果表明，在生物医学文献上进行预训练，然后针对特定任务进行微调的 Transformer 模型为这个问题提供了一个有希望的解决方案。该模型可以消除大多数研究问题中大量不相关的文章。此外，对我们训练数据中特定研究问题的分析表明，自然途径可以进一步改进。

发布时间: 10/14/2024

查看原文

ART：面向文本到图像模型的自动红队攻击，以保护良性用户

作者: Guanlin Li, Kangjie Chen, Shudong Zhang, Jie Zhang, Tianwei Zhang

大规模预训练生成模型凭借其生成创意内容的能力席卷全球。与此同时，为了保护用户的权利和安全，人们正在为这些生成模型开发安全保障措施，其中大多数是为大型语言模型设计的。现有方法主要集中在越狱和对抗攻击方面，这些方法主要评估模型在恶意提示下的安全性。最近的研究发现，人工编制的安全提示可能会无意中触发不安全的生成。为了更系统地评估文本到图像模型的安全风险，我们提出了一种新颖的自动红队框架 ART。我们的方法利用视觉语言模型和大型语言模型，在不安全的生成及其提示之间建立联系，从而更有效地识别模型的漏洞。通过我们全面的实验，我们揭示了流行的开源文本到图像模型的毒性。实验还验证了 ART 的有效性、适应性和多样性。此外，我们还引入了三个大型红队数据集，用于研究与文本到图像模型相关的安全风险。数据集和模型可以在 https://github.com/GuanlinLee/ART 中找到。

发布时间: 10/14/2024

查看原文

策略性人工代理下的数据标注自动化：风险与潜在解决方案

作者: Tian Xie, Xueru Zhang

随着机器学习（ML）模型在社会领域中被越来越多地用于做出对人类有重大影响的决策，它们往往具有重塑数据分布的能力。人类作为战略性主体，不断调整其行为以应对学习系统。由于人口动态变化，ML 系统可能需要频繁更新以确保高性能。然而，在社会领域获取高质量的人工标注样本可能极具挑战，甚至不可行。解决此问题的一种常见做法是使用模型本身来标注未标注的数据样本。本文研究了当 ML 模型在包含人类战略性响应的情况下使用模型标注样本进行再训练时，其长期影响。我们首先将战略性主体与模型之间的交互形式化，然后分析它们在这种动态交互下的演变过程。我们发现，随着模型的重新训练，主体越来越有可能获得积极的决策，而具有积极标签的群体比例可能会随着时间的推移而下降。因此，我们提出了一种改进的再训练过程来稳定这种动态。最后，我们考察了这些再训练过程如何影响算法公平性，并发现，在每一轮都强制执行常见的公平性约束可能不会从长远来看有利于弱势群体。在（半）合成数据和真实数据上的实验验证了理论发现。

发布时间: 10/14/2024

查看原文

解决方案效率和指令效价对人类和 GPT-4 加减策略的影响

作者: Lydia Uhler, Verena Jordan, J\"urgen Buder, Markus Huff, Frank Papenmeier

生成式人工智能，尤其是大型语言模型（LLM），正被越来越多地使用，因此需要对其能力进行透明化。虽然先前的研究表明人类（Adams 等人，2021）和 OpenAI 的 GPT-3（Winter 等人，2023）存在加法偏差，但本研究通过比较人类和 GPT-4 在空间和语言任务中的问题解决能力，并对解决方案效率和任务指令的效价进行不同的变化，扩展了研究。四项预先注册的实验，参与者来自美国，共 588 人，GPT-4 迭代 680 次，结果显示 GPT-4 比人类更倾向于使用加法转换。当减法比加法效率更高时，人类参与者不太可能使用加法策略；而当加法和减法效率相等时，他们使用加法策略的可能性更高。GPT-4 表现出相反的行为，当减法效率更高时，它表现出强烈的加法偏差。在任务指令的效价方面，当被指示“改进”（正效价）而不是“编辑”（中性效价）时，GPT-4 使用加法策略的次数增加了。这些发现表明，人类问题解决中的偏差在 GPT-4 的输出中被放大，并且 LLM 的解决方案策略不同于人类基于效率的策略。这突出了 LLM 的不断发展的局限性，以及在现实世界应用中使用它们时需要谨慎的必要性。

发布时间: 10/14/2024

查看原文

基于三维物体缩放的食物份量估计

作者: Gautham Vinod, Jiangpeng He, Zeman Shao, Fengqing Zhu

基于图像的方法分析食物图像，减轻了传统方法的用户负担和偏差。然而，由于智能手机摄像头或可穿戴设备拍摄的食物二维图像丢失了三维信息，准确的份量估计仍然是一个重大挑战。本文提出了一种新的框架，通过利用三维食物模型和进食场景中的物理参考，从二维图像中估计食物体积和能量。我们的方法估计了输入图像中相机和食物对象的姿态，并通过渲染具有估计姿态的三维食物模型的图像来重建进食场景。我们还引入了一个新的数据集 SimpleFood45，其中包含 45 种食物的二维图像，以及相关的注释，包括食物体积、重量和能量。我们的方法在这个数据集上实现了 31.10 kCal（17.67%）的平均误差，优于现有的份量估计方法。数据集可在 https://lorenz.ecn.purdue.edu/~gvinod/simplefood45/ 获取，代码可在 https://gitlab.com/viper-purdue/monocular-food-volume-3d 获取。

发布时间: 10/14/2024

查看原文

跨多个模拟世界扩展可指示代理

作者: SIMA Team, Maria Abi Raad, Arun Ahuja, Catarina Barros, Frederic Besse, Andrew Bolt, Adrian Bolton, Bethanie Brownfield, Gavin Buttimore, Max Cant, Sarah Chakera, Stephanie C. Y. Chan, Jeff Clune, Adrian Collister, Vikki Copeman, Alex Cullum, Ishita Dasgupta, Dario de Cesare, Julia Di Trapani, Yani Donchev, Emma Dunleavy, Martin Engelcke, Ryan Faulkner, Frankie Garcia, Charles Gbadamosi, Zhitao Gong, Lucy Gonzales, Kshitij Gupta, Karol Gregor, Arne Olav Hallingstad, Tim Harley, Sam Haves, Felix Hill, Ed Hirst, Drew A. Hudson, Jony Hudson, Steph Hughes-Fitt, Danilo J. Rezende, Mimi Jasarevic, Laura Kampis, Rosemary Ke, Thomas Keck, Junkyung Kim, Oscar Knagg, Kavya Kopparapu, Rory Lawton, Andrew Lampinen, Shane Legg, Alexander Lerchner, Marjorie Limont, Yulan Liu, Maria Loks-Thompson, Joseph Marino, Kathryn Martin Cussons, Loic Matthey, Siobhan Mcloughlin, Piermaria Mendolicchio, Hamza Merzic, Anna Mitenkova, Alexandre Moufarek, Valeria Oliveira, Yanko Oliveira, Hannah Openshaw, Renke Pan, Aneesh Pappu, Alex Platonov, Ollie Purkiss, David Reichert, John Reid, Pierre Harvey Richemond, Tyson Roberts, Giles Ruscoe, Jaume Sanchez Elias, Tasha Sandars, Daniel P. Sawyer, Tim Scholtes, Guy Simmons, Daniel Slater, Hubert Soyer, Heiko Strathmann, Peter Stys, Allison C. Tam, Denis Teplyashin, Tayfun Terzi, Davide Vercelli, Bojan Vujatovic, Marcus Wainwright, Jane X. Wang, Zhengdong Wang, Daan Wierstra, Duncan Williams, Nathaniel Wong, Sarah York, Nick Young

构建能够在任何3D环境中遵循任意语言指令的具身AI系统，是创造通用AI的关键挑战。实现这一目标需要学习将语言与感知和具身行动联系起来，以完成复杂的任务。可扩展、可指示、多世界智能体（SIMA）项目通过训练智能体在各种虚拟3D环境中遵循自由形式的指令来解决这个问题，包括精心策划的研究环境以及开放式商业视频游戏。我们的目标是开发一个可指示的智能体，它能够在任何模拟的3D环境中完成人类可以完成的任何事情。我们的方法侧重于语言驱动的通用性，同时对假设的限制降到最低。我们的智能体使用通用的类人界面实时与环境交互：输入是图像观察和语言指令，输出是键盘和鼠标操作。这种通用方法具有挑战性，但它允许智能体将语言与许多视觉上复杂且语义丰富的环境联系起来，同时还允许我们在新环境中轻松运行智能体。在本文中，我们描述了我们的动机和目标、已经取得的初步进展，以及在几个不同的研究环境和各种商业视频游戏中取得的有希望的初步结果。

发布时间: 10/14/2024

查看原文

负偏好优化：从灾难性崩溃到有效遗忘

作者: Ruiqi Zhang, Licong Lin, Yu Bai, Song Mei

大型语言模型 (LLM) 在预训练过程中通常会记忆敏感、私密或受版权保护的数据。LLM 遗忘旨在消除预训练模型中不受欢迎数据的影響，同时保留模型在其他任务上的效用。最近提出了几种用于 LLM 遗忘的实用方法，大多数基于对不受欢迎数据的损失的梯度上升 (GA)。然而，在某些遗忘任务中，这些方法要么无法有效地遗忘目标数据，要么会遭受灾难性崩溃——模型效用急剧下降。本文提出了一种名为负偏好优化 (NPO) 的简单、受对齐启发的方法，它可以有效地遗忘目标数据集。我们从理论上证明，通过最小化 NPO 损失，向灾难性崩溃的进展速度比 GA 指数级慢。通过对合成数据和 TOFU 基准数据集的实验，我们证明了基于 NPO 的方法在遗忘不受欢迎数据和保持模型效用之间取得了更好的平衡。我们还观察到，基于 NPO 的方法比基于 GA 的方法生成更合理的输出，而基于 GA 的方法的输出通常是胡言乱语。值得注意的是，在 TOFU 上，基于 NPO 的方法是第一个在遗忘 50%（或更多）训练数据的情况下取得合理遗忘结果的方法，而现有方法在遗忘 10% 的训练数据时就已经遇到了困难。

发布时间: 10/14/2024

查看原文

理解标签平滑如何损害选择性分类以及如何修复它

作者: Guoxuan Xia, Olivier Laurent, Gianni Franchi, Christos-Savvas Bouganis

标签平滑（LS）是一种流行的神经网络训练正则化方法，它在提高测试准确率方面非常有效，并且易于实现。通过将概率质量均匀分布到其他类别，硬独热标签被平滑，从而减少过度拟合。先前的工作表明，在某些情况下，LS 会降低选择性分类（SC）的性能，而 SC 的目标是利用模型的不确定性来拒绝误分类。在本研究中，我们首先通过对一系列大规模任务和架构进行实证研究，证明 LS 始终会导致 SC 性能下降。然后，我们填补了现有知识的空白，通过分析logit级别的梯度来解释这种现象：LS 通过在预测正确时更多地正则化最大logit，而在预测错误时更少地正则化最大logit，从而降低了正确预测与错误预测的不确定性排序。这解释了先前报道的强分类器在 SC 中表现不佳的实验结果。然后，我们证明了事后logit归一化在恢复因 LS 导致的 SC 性能下降方面的有效性。此外，我们再次将分析结果与我们的梯度分析联系起来，并解释了这种归一化方法有效的原因。

发布时间: 10/14/2024

查看原文