LLM2D

arXiv 论文列表

作者: Harry Mead, Clarissa Costen, Bruno Lacerda, Nick Hawes
arXiv:2504.20887v1 交叉公告类型 摘要: 当使用策略梯度(PG)优化条件价值-at-风险(CVaR)时,当前的方法依赖于丢弃大量轨迹,导致样本效率较差。我们提出了一种通过限定用于训练的轨迹的总回报来重新表述CVaR优化问题的方法,而不是简单地丢弃这些轨迹,并表明如果设定合适的上限,则这种重新表述等同于原始问题。我们通过在多个环境中进行的实验证明,这种问题重新表述的结果相较于基线方法能够一致地提高性能。
发布时间: 4/30/2025
查看原文
作者: Junyuan Fang, Han Yang, Haixian Wen, Jiajing Wu, Zibin Zheng, Chi K. Tse
arXiv:2504.20869v1 交叉类型:公告 摘要:图神经网络由于其在利用邻居的局部信息方面强大的学习能力,已经被广泛应用于图相关的任务。然而,最近关于图对抗攻击的研究已经证明,当前的图神经网络在对抗恶意攻击时并不 robust。尽管迄今为止大部分工作都集中在基于攻击效果的优化目标上以获得(接近)最优的扰动,但对每个扰动(如特定节点/边的注入)的强度量化关注较少,这使得选择扰动成为一个缺乏可解释性的黑盒模型。在这项工作中,我们提出了噪声的概念来量化每个对抗边的攻击强度。此外,我们基于所定义的噪声和单步与多步优化中的分类边际,提出了三种攻击策略。在针对三个代表性图神经网络进行的基准数据集上的广泛实验中,展示了所提出攻击策略的有效性。特别是,我们还通过分析所选扰动节点的相应属性,研究了有效对抗扰动的偏好模式。
发布时间: 4/30/2025
查看原文
作者: Dayananda Herurkar, J\"orn Hees, Vesselin Tzvetkov, Andreas Dengel
arXiv:2504.20862v1 Announce Type: cross 摘要:深度学习方法的显著成功往往基于并演示在大规模公共数据集上。然而,在将这些方法应用于内部私有数据集时,经常会面临由于数据集结构差异、领域转移以及缺乏标签而带来的挑战。在本工作中,我们提出了表格数据适配器(TDA),这是一种用于生成未标记表格数据在离群值检测任务中的软标签的新型方法。通过识别统计上相似的公共数据集,并基于共享的自编码器将私有数据转换为与最新公共模型兼容的格式,我们的方法能够生成弱标签。因此,它有助于通过基于现有公共数据集的离群值检测模型来缓解标签冷启动问题。在对50个不同领域的表格数据集进行的实验中,我们证明,与基线方法相比,我们的方法能够提供更准确的注释同时减少计算时间。我们的方法提供了一个可扩展、高效且成本效益高的解决方案,以弥合公共研究模型与实际工业应用之间的差距。
发布时间: 4/30/2025
查看原文
作者: Guy Hadad, Haggai Roitman, Yotam Eshel, Bracha Shapira, Lior Rokach
arXiv:2504.20859v1 交叉类型:跨域 摘要:随着新产品的不断涌现,推荐系统需要快速适应可能的新领域,而无需进行广泛的重新训练。本文提出了“X-Cross”——一种新颖的跨域序列推荐模型,通过集成多个领域特定的语言模型来进行新产品推荐;每个模型通过低秩适配器(LoRA)进行微调。给定一个推荐提示,X-Cross 按层操作,动态细化每个源语言模型的表示,通过整合所有其他模型的知识。这些细化的表示从一层传递到下一层,利用每个领域适配器的激活,确保保留领域特定的细微差别,同时跨领域实现适应性。使用亚马逊数据集进行序列推荐,X-Cross 在性能上达到了与使用 LoRA 进行微调的模型相当的结果,而只需要额外参数的25%。在跨域任务中,如从玩具领域adapt到工具、电子产品或运动,X-Cross 展示出稳健的性能,同时所需的微调数据量大约减少50%-75%即可实现有效的微调。此外,X-Cross 在替代跨域基线上的准确性上取得了显著的改进。总体而言,X-Cross 使跨域推荐具有可扩展和适应性,减少了计算开销,并为数据受限的环境提供了高效的解决方案。
发布时间: 4/30/2025
查看原文
作者: Jinsun Yoo, ChonLam Lao, Lianjie Cao, Bob Lantz, Minlan Yu, Tushar Krishna, Puneet Sharma
arXiv:2504.20854v1 测试框架类型:跨平台 摘要:本文为Genie测试框架奠定了基础,该框架可以捕捉真实硬件网络行为对ML工作负载性能的影响,而无需使用昂贵的GPU。Genie使用CPU引发的流量在硬件测试床上来模拟GPU到GPU的通信,并将ASTRA-sim仿真器调整为建模网络与ML工作负载之间的交互。
发布时间: 4/30/2025
查看原文
arXiv:2504.20851v1 Announce Type: 跨学科 摘要:在由去中心化的知识生态系统和无处不在的人工智能技术日益塑造的时代,培养可持续的学习者自主性已成为教育的紧迫需求。本研究介绍了一种新的概念框架,将生成人工智能与学习分析相结合,以培养自我引导成长这一动态技能,使学习者能够在多样化的背景下,不断自主驱动自己的发展路径。基于当前关于自主学习和人工智能介入教育研究中的关键空白,提出的“提升学习者潜能”(A2PL)模型重新构想了学习者抱负、复杂思维和总结性自我评估在生成人工智能支持环境中的相互作用。探讨了未来干预设计和学习分析应用的方法论含义,将自我引导成长定位为数字时代发展中公平、适应性和可持续学习体系的关键轴心。
发布时间: 4/30/2025
查看原文
作者: Junyuan Fang, Huimin Liu, Han Yang, Jiajing Wu, Zibin Zheng, Chi K. Tse
arXiv:2504.20848v1 类别:交叉学科 摘要: 近年来,图神经网络(GNNs)在处理各种图结构相关的下游任务中展现了巨大的潜力。然而,最近的研究发现,现有的GNNs对恶意的对抗攻击非常敏感。鉴于对抗攻击在现实世界中的不可避免性,已经提出了一系列防御方法来应对这些攻击并增强GNNs的鲁棒性。尽管这些防御方法表现优异,但我们观察到,它们在涉及节点低度(即尾节点)的防御能力上存在结构偏见,类似于传统的图神经网络在干净图中对低度节点的结构偏见。因此,在本文中,我们提出了一种防御策略,通过包含异构-同质增强图构建、$k$NN增强图构建和多视图节点注意力模块来缓解GNNs在对抗攻击下的结构偏见。值得注意的是,异构-同质增强图是通过全局移除异质链接(即连接具有不同特性的节点的链接)并为低度节点添加同质链接(即连接具有相似特性的节点的链接)构建的。为了进一步增强防御能力,我们采用了注意机制来适应性地结合上述两种类型的图视图的表示。我们进行了大量实验,以在基准数据集上证明所提出策略的防御和解偏效果。
发布时间: 4/30/2025
查看原文
作者: Julien Khlaut, Elodie Ferreres, Daniel Tordjman, H\'el\`ene Philippe, Tom Boeken, Pierre Manceron, Corentin Dancette
arXiv:2504.20837v1 类别: cross 摘要:医学图像分割是临床护理中一项关键且耗时的任务,其中掩膜精度极其重要。Segment Anything Model (SAM) 提供了一个有前景的方法,因为它基于视觉提示和编辑提供了交互界面,用于细化初始分割。该模型具有强大的泛化能力,不需要预先定义的类别,并且能够适应各种对象;然而,它是在自然图像上预训练的,缺乏有效处理医学数据的能力。此外,该模型是为2D图像设计的,而医学领域的整个领域基于3D图像,如CT和MRI。最近的SAM在医学成像中的适应是基于2D模型,因此需要一个提示来分割每个切片中的3D对象,从而使分割过程变得繁琐。此外,它们缺乏编辑等功能。为了弥补这一差距,我们提出了一种新的方法RadSAM,用于使用单个提示从2D模型分割3D对象。实践中,我们使用噪声掩膜作为初始提示训练2D模型,同时使用边界框和点。然后,我们使用这种新型提示类型与迭代推理管道来逐切片重建3D掩膜。我们引入了一个基准评估模型在单个提示下从CT图像中分割3D对象的能力,以及模型的领域外迁移和编辑能力。我们使用AMOS腹部器官分割数据集展示了我们的方法在该基准上的有效性,与最先进的模型进行了对比。
发布时间: 4/30/2025
查看原文
arXiv:2504.20834v1 类型: cross 摘要: 我们研究了在大语言模型(LLMs)的内存和计算受限条件下,通过强化学习(RL)技术提升目标问题空间内的推理能力。我们专注于与单个40GB GPU上的LoRA微调兼容的无评论者方法,这是学术环境中常见的限制。我们引入了S-GRPO,这是一个记忆高效的Group Relative Policy Optimization变体,以及T-SPMO,这是一种用于细粒度信用分配的令牌级前缀匹配策略。即使在资源有限的情况下,当使用LoRA训练对Qwen2-1.5B进行微调时,这两种方法都能显著提高SVAMP基准测试的准确性,达到超过70%。T-SPMO在多位数乘法任务上的表现也尤为出色,这突显了在硬件限制下进行RL微调的潜力。此外,我们发现我们的全令牌GRPO基准在LoRA微调下没有提高模型在这两项任务上的性能(与基模型相比),这表明我们的记忆高效方法可能作为一种正则化手段,在只更新一小部分参数时稳定训练。
发布时间: 4/30/2025
查看原文
作者: Jiaxin Hong, Sixu Chen, Shuoyang Sun, Hongyao Yu, Hao Fang, Yuqi Tan, Bin Chen, Shuhan Qi, Jiawei Li
arXiv:2504.20829v1 Announce Type: 横向 摘要:随着3D高斯斑点渲染(3DGS)在场景表示和新颖视图合成方面取得突破,其在安全关键领域(例如,自动驾驶系统、AR/VR)的迅速采用迫切需要审查潜在的安全漏洞。本文介绍了3DGS流水线中后门威胁的第一个系统性研究。我们发现,攻击者可以植入后门视图,在推理过程中诱导恶意场景混淆,可能会导致自动驾驶导航中的环境误感知或沉浸式环境中的空间失真。为了揭示这种风险,我们提出了一种名为GuassTrap的新颖投毒攻击方法,专门针对3DGS模型。GuassTrap在特定攻击视角下注入恶意视图,同时在非目标视图中保持高质量渲染,确保最小的可检测性并最大化潜在危害。具体来说,该提议的方法由三个阶段的流水线(攻击、稳定和正常训练)组成,以在3DGS中植入隐蔽且视角一致的投毒渲染,同时联合优化攻击效果和感知现实性,揭示3D渲染中的安全风险。在合成数据集和真实世界数据集上的广泛实验表明,GuassTrap可以在保持常规视图高质量渲染的同时,有效地嵌入不可察觉但有害的后门视图,验证了其鲁棒性、适应性和实际应用价值。
发布时间: 4/30/2025
查看原文