arXiv:2502.01885v1 类型: cross
摘要:静息状态功能性磁共振成像(rs-fMRI)及其衍生的功能连接网络(FCNs)已成为理解神经疾病的关键。然而,由于隐私法规和来自多个数据源的非-IID(非独立且同分布)性质,协作分析和模型的一般化面临重大挑战。为解决这些困难,我们提出了一种新的联邦深度学习框架——域对抗联邦学习(DAFed),专门用于多站点设置中非-IID fMRI数据的分析。DAFed通过特性分离解决了这些挑战,将潜在特征空间分解为域不变和域特定组件,以确保稳健的全局学习的同时保留局部数据的特定性。此外,对抗训练促进了标记和未标记数据集之间的有效知识转移,而对比学习模块增强了域不变特征的全局表示。我们对ASD的诊断进行了DAFed的评估,并进一步验证了其在AD分类中的可泛化性,证明了其分类准确性优于当前最先进的方法。此外,增强的Score-CAM模块分别识别了与ASD和MCI显著相关的关键脑区和功能连接,揭示了不同站点之间共享的神经生物学模式。这些发现强调了DAFed在保护数据机密性的同时,能够推动神经影像学多站点合作研究的潜力。
arXiv:2502.01866v1 通告类型: 综合交叉学科
摘要:在线连续学习(OCL)模型不断适应非平稳数据流,通常不包含任务信息。这些设置是复杂的,许多传统的连续学习(CL)方法在此类设置下失效,而在线方法(主要是基于回放的方法)在任务变更后会遇到不稳定性问题。为了解决这一问题,我们将基于回放的OCL形式化为具有显式KL散射约束的二阶在线联合优化。我们提出了在线曲率感知回放(OCAR),这是一种利用Fisher信息矩阵(FIM)的二阶损失信息近似(K-FAC)来预条件化梯度的方法。FIM充当稳定剂,防止遗忘,同时加快非干扰方向的优化。我们展示了如何将FIM的估计适应于连续设置,在非同分布数据下稳定二阶优化,并揭示了Tikhonov正则化在稳定性和可塑性权衡中的作用。实验证明,OCAR在连续学习指标中优于现有方法,在三个不同基准测试中,通过训练过程始终获得更高的平均准确性。
arXiv:2502.01857v1 宣言类型: cross
摘要:在信息不完整的环境中,人机协作导航具有挑战性。我们引入了CoNav-Maze,这是一个模拟的机器人环境,其中机器人使用局部感知导航,而人类操作员则基于不准确的地图提供指导。机器人可以分享其相机视图以提高操作员对环境的理解。为了实现高效的人机协作,我们提出了信息增益蒙特卡洛树搜索(IG-MCTS),这是一种在线规划算法,能够在自主移动和信息性通信之间进行平衡。IG-MCTS的核心是一个神经人类感知动力学模型,该模型估计人类如何从机器人的通信中提取信息。我们通过众包测绘任务在CoNav-Maze中收集了一个数据集,并使用数据增强的全卷积架构训练了该模型。用户研究表明,IG-MCTS在通信量显著减少和人类认知负荷降低的情况下,与遥操作和指令跟随基线相比,实现了相当的任务性能,这从眼球追踪指标中得到了证明。
arXiv:2502.01839v1 采样类型: 横跨
摘要:基于采样的搜索是一种利用测试时计算的简单范式,涉及生成多个候选答案并选择最佳的——通常通过对每个答案进行正确性验证来实现。在本文中,我们研究了控制基于采样的搜索的可扩展性趋势。我们的发现之一是,仅仅通过增加仅使用随机采样和直接自验证的极简实现方式进行扩展,可以带来持续的性能提升,例如,使Gemini v1.5 Pro模型在流行基准上的推理能力超过了o1-Preview。我们部分将基于采样的搜索的可扩展性归因于隐式的可扩展性现象,即对更多回答的采样反过来提高了验证的准确性。我们还识别了两条提高自验证能力的有用原则:(1)比较不同的回答可以提供关于错误和幻觉位置的有用信号,(2)不同的模型输出样式在不同的上下文中是有用的——思维链在推理中很有用,但验证起来却很困难。我们还发现,尽管可以通过准确的验证被激发出来,前沿模型显示出令人惊讶的薄弱的开箱即用验证能力,并引入了一个基准来衡量对这些不足的进展。
arXiv:2502.01837v1 宣布类型: crossover
摘要:对边缘设备上深度神经网络(DNNs)的低功耗推理和训练的需求加剧了对既具有可扩展性又节能的算法的需求。尽管突触神经网络(SNNs)通过事件驱动的方式来高效地处理复杂的时空动态,但传统基于错误反向传播(BP)的方法由于计算和内存需求高,仍然使在资源受限的设备上训练SNNs充满挑战。在本文中,我们从生物学机制,如资格迹、事件时间依赖塑性以及神经活动同步中汲取灵感,引入了一种时空局部学习规则TESS,用于训练SNNs。我们的方法通过仅依赖于每个神经元内部本地可用的信号来解决时间和空间的功劳归属问题,从而使得计算和内存开销能够线性地与神经元的数量成比例增长,而与时间步数无关。尽管依赖于本地机制,我们展示了在边缘相关的具有挑战性的计算机视觉场景中性能与时间反向传播(BPTT)算法相当,例如IBM DVS手势数据集、CIFAR10-DVS以及CIFAR10和CIFAR100的时间版本的性能只相差约1.4个准确性点。能够同时保持低时间和内存复杂性并达到与BPTT相当的性能,TESS使得边缘设备的高效和可扩展的学习成为可能。
arXiv:2502.01825v1 宣告类型: cross
摘要: 数据扩充已经成为软件工程中处理数据集有限或不平衡的标准做法,特别是在测试分类和漏洞检测等专门领域,这些领域的数据可能较少。尽管在软件测试和调试应用程序中广泛使用了诸如SMOTE和基于变异的扩充等技术,但关于扩充后的训练数据如何影响模型偏差的理解还不够严谨。在使用扩充数据集不仅用于训练,还用于测试模型的情况下,考虑偏差尤为重要。通过对脆弱测试分类的全面案例研究,我们展示了如何测试偏差以及在测试集中包含扩充样本如何影响模型评估的理解。
arXiv:2502.01821v1 类别: cross
摘要:bug报告往往缺乏开发人员重现和修复潜在缺陷所需的足够详细信息。当存在bug时失败并在bug已被修复时通过的测试被称为Bug Reproduction Tests(BRTs),这些测试对于调试至关重要,但在开源和工业环境中,BRTs通常不会包含在bug报告中。因此,从bug报告中自动生成BRTs有潜力加速调试过程并降低修复时间。本文研究了在工业环境中自动生成BRTs,特别是在Google的具体环境中,重点关注大型专有代码库的挑战,并考虑从Google内部问题跟踪器中提取的实际工业bug。我们适应并评估了一种最先进的BRT生成技术LIBRO,并提出了一种基于代理的 approach,BRT Agent,该方法利用微调的大语言模型(LLM)进行代码编辑。我们的BRT Agent在Google内部问题跟踪器上的人工报告的80个bug中,实现了28%的可能BRT生成率,而LIBRO仅为10%。我们进一步通过将生成的BRT与Google的自动化程序修复系统(APR)结合,探讨了生成BRT的实际价值。结果显示,将BRT提供给APR系统可以导致带有可能修复的bug增加30%。此外,我们引入了Ensemble Pass Rate(EPR)这一指标,该指标利用生成的BRT来从APR系统生成的所有修复中选择最有前途的修复。我们对EPR在Top-K和阈值基础上的修复选择进行了评估,结果表现出色且具有权衡。例如,基于其top-1排名,EPR在70%的情况下能够正确从20个候选修复中选择一个可能的修复。
arXiv:2502.01819v1 交叉公告类型:
摘要:使用人类反馈进行强化学习(RLHF),将扩散模型与输入提示对齐,已成为构建可靠的生成AI模型的关键步骤。该领域大多数现有工作采用离散时间形式,这容易引起错误,并且往往不适用于具有高阶/黑盒求解器的模型。本研究的目标是通过连续时间RL开发一种严谨的方法来微调扩散模型,将其表述为一种具有奖励函数的随机控制问题,该奖励函数将最终结果(终端状态)与输入提示对齐。关键思想是将分数匹配视为控制或动作,从而将分数匹配与连续时间RL中的策略优化和正则化联系起来。为了实现这一思想,我们提出了一种新的连续时间RL策略优化框架,并通过利用扩散模型的结构属性来增强价值网络的设计空间,展示了其潜力。我们通过在Stable Diffusion v1.5的大规模文本转图像模型微调下游任务中的实验验证了我们方法的优势。
arXiv:2502.01806v1 交叉领域类型:
摘要:大型语言模型(LLMs)的最新进展为大型代码模型(LCMs)铺平了道路,使得在复杂软件工程任务(如代码生成、软件测试和程序理解等)中实现了自动化。像GitHub Copilot和ChatGPT这样的工具在各个开发实践方面为开发者提供了显著的好处。然而,将这些模型扩展到万亿参数规模,例如GPT-4所展示的,带来了显著的挑战,限制了基于大型深度学习(DL)模型的人工智能(AI)系统的使用。这些挑战包括训练和部署所需的日益增长的计算需求以及与可信度、偏差和可解释性相关的问题。这些因素可能使得许多组织难以管理这些模型,而其“黑箱”性质削弱了透明度和问责制等方面的关键方面。在本文中,我们质疑一个普遍的假设,即在有足够的新数据可以学习更多模式的情况下,增加模型参数总是前进的最佳路径。特别地,我们提倡一种综合现有DL技术(例如LLMs)和传统符号方法的研究方向,传统符号方法以其可靠性、速度和确定性而闻名。为此,我们概述了该方法的核心特征,并初步展示了我们设想的方法的成果,旨在建立第一个神经符号程序理解(NsPC)框架,以帮助识别缺陷代码组件。
arXiv:2502.01803v1 公告类型:交叉
摘要:理解神经网络具有挑战性,因为它们由高维度的相互作用组件构成。受人类认知的启发,人类通过将复杂的感官数据分块为重复的实体来处理复杂的数据,我们提出利用这一原则来解释人工神经群体活动。生物学和人工智能都面临着从结构化的自然数据中学习的挑战,我们假设分块的认知机制可以为人工系统提供见解。我们首先在受规则约束的人工序列上训练的循环神经网络(RNNs)中证明了这一概念,观察到它们的隐藏状态反映了这些模式,这些模式可以通过提取影响网络响应的分块词典来提取。将这一概念扩展到大型语言模型(LLMs)如LLaMA,我们识别出类似的重复嵌入状态,这些状态对应于输入中的概念,对这些状态的扰动激活或抑制相关的概念。通过探索提取不同复杂性神经嵌入中可识别分块词典的方法,我们的研究成果引入了一种新的框架来解释神经网络,将它们的群体活动构架为对所处理数据的结构化反映。