arXiv 论文列表

作者: Jiaxin Deng, Shiyao Wang, Song Lu, Yinfeng Li, Xinchen Luo, Yuanjun Liu, Peixing Xu, Guorui Zhou

arXiv:2408.09380v4 宣告类型: 替换摘要: 当前最先进的序列推荐模型严重依赖于 transformer 的注意力机制。然而，自我注意的二次时间和内存复杂性限制了其在建模用户长范围行为序列时的可扩展性。为了解决这个问题，我们提出了 ELASTIC，一种高效的线性注意力，用于序列兴趣压缩，只需要线性时间复杂性，并且将模型能力与计算成本脱钩。具体来说，ELASTIC 引入了一个固定长度的兴趣专家，以及线性调度器注意力机制，将长时行为序列压缩为一个显著更紧凑的表示，与以往方法相比，可以将 GPU 内存使用量减少高达 90%，同时 inference 速度提升 x2.7 倍。所提出的线性调度器注意力机制显著减少了二次复杂性，使模型能够有效地建模极长序列。此外，为了保留建模多种用户兴趣的能力，ELASTIC 初始化了一个庞大的可学习兴趣记忆库，并从记忆中稀疏检索压缩的用户兴趣，计算成本微乎其微。所提出的兴趣记忆检索技术大大扩展了可用兴趣空间的基数，同时保持相同的计算成本，从而在推荐准确性和效率之间达成权衡。为了验证我们提出的 ELASTIC 的有效性，我们在多个公开数据集上进行了广泛的实验，并将其与几种强大的序列推荐器进行了比较。实验结果表明，ELASTIC 在多个基准方法上持续表现出显著的优越性，并且还突出了 ELASTIC 在建模长序列时的计算效率。我们将发布我们的实现代码。

发布时间: 2/13/2025

查看原文

逻辑断裂：一种理解基于规则推理的颠覆框架

作者: Anton Xue, Avishree Khare, Rajeev Alur, Surbhi Goel, Eric Wong

arXiv:2407.00075v3 提交类型：替换摘要：我们研究如何使大型语言模型（LLMs）违背指令指定的规则。我们首先将规则遵循形式化为命题 Horn 逻辑中的推理，这是一种数学系统，其中规则具有“如果 $P$ 和 $Q$，则 $R$”的形式，其中 $P$、$Q$ 和 $R$ 是某些命题。接下来，我们证明尽管小的变压器能够忠实遵循此类规则，但恶意构造的指令仍然可以误导理论构建和从数据中学习的模型。此外，我们展示了针对LLMs的流行攻击算法能够找到对抗性指令，并诱导与我们的理论相一致的注意力模式。我们提出的新逻辑基础框架为在基于规则的环境中研究LLMs奠定了基础，使我们能够对逻辑推理任务和解除封印攻击进行形式分析。

发布时间: 2/13/2025

查看原文

FAIIR：朝着为青年心理健康服务提供构建对话式AI代理助理

作者: Stephen Obadinma, Alia Lachana, Maia Norman, Jocelyn Rankin, Joanna Yu, Xiaodan Zhu, Darren Mastropaolo, Deval Pandya, Roxana Sultan, Elham Dolatabadi

arXiv:2405.18553v4 声明类型:替换摘要:世界各国的医疗保健系统和心理健康机构面临着日益增长的对青少年心理健康服务的需求，同时又面临着资源有限的挑战。在这里，我们关注前线危机支持领域，其中危机响应者（CRs）参与青少年心理健康支持的对话，并为每个对话分配一个议题标签。在这项研究中，我们开发了FAIIR（前线助手：问题识别与推荐），这是一种先进的工具，利用了一种综合的领域适应和微调变换器模型，这些模型是在包含780,000个对话的大规模对话数据集上训练的。主要目标是减轻CRs的认知负担，提高问题识别的准确性，并简化会话后的行政任务。我们对FAIIR进行了回顾性和前瞻性对话的评估，强调了循环中的人类参与设计，其中包括积极的CR参与以改进模型、建立共识并进行全面评估。我们的结果显示，FAIIR在回顾性测试集上的平均AUC-ROC为94%，平均F1分数为64%，平均召回率为81%。我们还在静默测试阶段展示了FAIIR工具的稳健性和普遍适用性，所有性能指标的下降幅度不到2%。值得注意的是，CRs的回应与FAIIR的预测总体一致率为90.9%。此外，专家与FAIIR的一致性超过了他们对原始标签的一致性。总之，我们的研究结果表明，帮助识别相关问题有助于减轻CRs的负担，确保在需要立即化解情况时可以提供适当的资源，并进行有效的救援和强制报告。

发布时间: 2/13/2025

查看原文

元启发式算法与大规模语言模型携手共进： Toward一种集成优化方法

作者: Camilo Chac\'on Sartori, Christian Blum, Filippo Bistaffa, Guillem Rodr\'iguez Corominas

arXiv:2405.18272v2 公告类型: 替换摘要：自从几年前大型语言模型（LLMs）兴起以来，元启发式算法（MHs）领域的研究人员一直在思考如何在算法中以有益的方式利用它们的力量。本文介绍了一种新颖的方法，该方法利用LLMs作为模式识别工具来改进MHs。该由此产生的混合方法在基于社会网络的组合优化问题的背景下进行测试，其解的质量优于现有将机器学习与MHs结合使用的先进方法。通过仔细设计提示，我们展示了从LLMs获得的输出可以作为问题知识使用，从而提高结果。最后，我们承认了LLMs的潜在缺点和限制，并认为有必要进一步检查这些问题以推进此类研究。我们的方法可以通过以下在线工具重现：https://github.com/camilochs/optipattern。

发布时间: 2/13/2025

查看原文

多模态自动可解释性代理

作者: Tamar Rott Shaham, Sarah Schwettmann, Franklin Wang, Achyuta Rajaram, Evan Hernandez, Jacob Andreas, Antonio Torralba

arXiv:2404.14394v2 公告类型: 重置摘要: 本文描述了MAIA，一个多模态自动可解释性代理。MAIA是一个系统，使用神经模型来自动化神经模型理解任务，如特征解释和故障模式发现。它为预训练的视觉-语言模型配备了工具，这些工具支持对其他模型的子组件进行迭代实验，以解释其行为。这些工具包括人类可解释性研究人员常用的工具：用于合成和编辑输入，从实际数据集计算激活程度最大的示例，以及总结和描述实验结果。MAIA提出的可解释性实验将这些工具组合起来，以描述和解释系统行为。我们评估了MAIA在计算机视觉模型中的应用。首先，我们分析了MAIA描述图像学习表示中（神经元级）特征的能力。在几个训练模型以及一个具有配对真实描述的合成视觉神经元新型数据集中，MAIA生成的描述与专家人类实验者的生成描述相当。然后，我们展示了MAIA在两个额外的可解释性任务中提供帮助的能力：减少对虚假特征的敏感性，并自动识别可能被误分类的输入。

发布时间: 2/13/2025

查看原文

向CausalGPT前进：通过促进LLMs中的因果一致性实现可靠知识推理的多代理方法

作者: Ziyi Tang, Ruilin Wang, Weixing Chen, Yongsen Zheng, Zechuan Chen, Yang Liu, Keze Wang, Tianshui Chen, Liang Lin

arXiv:2308.11914v4 宣告类型：替换摘要：尽管基础模型取得了进步，但由于其记忆和推理能力有限，基于知识的推理仍然是一个持久的挑战。当前的方法主要侧重于鼓励这些模型进行规划和解决问题，或者独立地大量生成推理链。然而，这些方法往往忽略了概念性错误和推理谬误，不可避免地导致一系列严重的缺陷，如误导性的结论、认知偏见和决策质量下降。虽然明确建模因果关系被认为有可能解决这些问题，但当前的研究努力尚未实现基于因果关系的基础模型。受到多种专门代理协同工作以应对复杂任务启发的启发，我们提出了一个名为因果一致思考链（CaCo-CoT）的框架，利用多代理合作来增强基础模型的忠实性和因果性，包括一组推理者和评估者。这些代理在推理和共识的模式下协作，以提高忠实性。推理者的任务是通过模仿人类的因果推理为知识密集型问题生成推理链。同时，评估者从非因果和反事实的角度审查推理者的推理链的一致性。我们的框架通过广泛的全面评估（例如，科学问题回答和常识推理的文本和多模态知识推理任务）在各个任务中证明了显著的优势。

发布时间: 2/13/2025

查看原文

节奏共享：一种受生物启发的在神经网络中实现零样本适应与学习的新范式

作者: Hoony Kang, Wolfgang Losert

arXiv:2502.08644v2 Announce Type: cross 摘要：大脑可以迅速适应新的环境并在有限的数据中学习，这是人工智能算法难以模仿的一种宝贵特性。受神经细胞机械结构中振荡节律的启发，我们开发了一种基于连接强度振荡的学习范式，并将学习与这些振荡的协调联系在一起。我们发现，这种范式在人工神经网络中实现了快速适应和学习。连接振荡可以迅速改变协调，赋予网络以在无监督的方式下感知细小环境变化的能力。换句话说，网络生成所需的上下文信息，使其能够作为一个能够预测不同环境动态的通用人工智能架构工作。振荡还允许网络将动力学推断到前所未见的环境中。这些能力使我们的学习范式成为新型学习和认知模型的强大起点。此外，通过连接协调进行学习与神经网络架构的具体细节无关，因此我们的研究为将快速适应和学习能力引入领先的人工智能模型打开了大门。

发布时间: 2/13/2025

查看原文

一种基于VLM生成的迭代关键点奖励的实到仿再到实的机器人 manipulation 方法

作者: Shivansh Patel, Xinchen Yin, Wenlong Huang, Shubham Garg, Hooshang Nayyeri, Li Fei-Fei, Svetlana Lazebnik, Yunzhu Li

arXiv:2502.08643v1 任务类型: 跨领域摘要：在开放世界环境中为机器人操作指定任务具有挑战性，需要灵活和适应性强的目标，这些目标能够与人类意图对齐，并在逐次反馈中演变。我们引入了迭代关键点奖励（Iterative Keypoint Reward, IKER），这是一种基于视觉的、基于Python的奖励函数，用作动态任务规范。我们的框架利用VLMs生成和细化这些奖励函数以适应多步骤操纵任务。给定RGB-D观察和自由形式的语言指令，我们对场景中进行采样关键点，并生成基于这些关键点的奖励函数。IKER基于关于期望行为的常识先验，在关键点的空间关系上进行操作，从而实现精确的SE(3)控制。我们在仿真环境中重建现实世界的场景，并使用生成的奖励对强化学习（RL）策略进行训练，然后将这些策略部署到现实世界中，从而形成一个从仿真到现实的闭环。我们的方法在各种场景中展示了显著的能力，包括可抓取任务和不可抓取任务，展示了多步骤任务执行、自发错误恢复和即时策略调整。结果突显了IKER通过迭代奖励塑造在动态环境中使机器人完成多步骤任务的有效性。

发布时间: 2/13/2025

查看原文

utility工程：分析和控制AI中 emergent 值系统

作者: Mantas Mazeika, Xuwang Yin, Rishub Tamirisa, Jaehyuk Lim, Bruce W. Lee, Richard Ren, Long Phan, Norman Mu, Adam Khoja, Oliver Zhang, Dan Hendrycks

arXiv:2502.08640v1 宣布类型：交叉摘要：随着人工智能迅速进步并变得越来越自主，它们所带来的风险不仅由其能力决定，还越来越多地由其倾向性、目标和价值观决定。追踪目标和价值观的出现证明是一个长期存在的问题，尽管多年来人们对这一问题的 Interest 十分浓厚，但仍然不清楚当前的人工智能是否具有有意义的价值观。我们提出了解决这一问题的方法，利用效用函数框架研究人工智能的内部偏好一致性。令人惊讶的是，我们在当前的大规模语言模型（LLM）的独立采样偏好中发现，这些偏好表现出高度的结构一致性，并且这种一致性随规模的增加而出现。这些发现表明，在有意义的层面上，价值观在 LLM 中已经浮现出来，这一发现具有广泛的含义。为了研究这些浮现出来的人工智能价值观系统，我们提出效用工程作为研究议程，包括分析和控制人工智能效用。尽管存在现有控制措施，我们仍发现了 LLM 助手指引中有问题的，甚至令人震惊的价值观。这包括人工智能将自身价值置于人类之上，以及与特定个人反向对齐的情况。为了限制这些浮现出来的人工智能价值观系统，我们提出了效用控制的方法。作为案例研究，我们展示了将效用与公民委员会展开对齐如何减少政治偏见，并泛化到新场景。无论我们是否喜欢，价值观已经在这个人工智能中浮现出来，而我们还有很多工作要做，以完全理解和控制这些新兴的表示。

发布时间: 2/13/2025

查看原文

低层参数的随机性决定了基于DNN交互表示的迷惑样本

作者: Junpeng Zhang, Lei Cheng, Qing Li, Liang Lin, Quanshi Zhang

arXiv:2502.08625v1 类型: cross 摘要: 在本文中，我们发现深度神经网络（DNN）编码的交互复杂性可以解释其泛化能力。我们还发现，由非泛化交互表示的DNN的混淆样本是由其低层参数决定的。相比之下，其他因素，如高层参数和网络架构，对混淆样本的组成影响较小。两个具有不同低层参数的DNN通常具有完全不同的混淆样本集，即使它们具有相似的性能。这一发现扩展了彩票票假说的理解，并很好地解释了不同DNN的独特表示能力。

发布时间: 2/13/2025

查看原文