arXiv:2504.01278v1 安全类型: 新
摘要: 大型语言模型(LLMs)被用于恶意目的将随着这些模型变得越来越强大和普及而带来重大的安全风险。虽然现有的红队框架大多侧重于单轮攻击,但现实世界的对手通常在多轮场景中运作,通过迭代地探测漏洞并在威胁模型响应的基础上调整提示。在本文中,我们提出了\AlgName,这是一种新颖的多轮红队代理,通过互补的学习维度来模拟复杂的真人攻击者:全局技巧层面的学习,随着时间的推移积累知识并将其泛化到新的攻击目标,和局部提示层面的学习,在初次尝试失败时细化针对特定目标的具体实现。与以往依赖固定策略集的多轮方法不同,\AlgName 允许代理识别新的脱困策略,开发基于目标的技巧选择框架,并针对选择的技巧细化提示公式。在 JailbreakBench 上的实际评估表明,我们的框架在性能上更优,实现对 GPT-3.5-Turbo 和 Llama-3.1-70B 在 5 轮对话内的攻击成功率超过 90%,超越了现有的最先进的基准。这些结果表明,在现实的多轮场景中,动态学习在识别和利用模型漏洞方面的有效性。
arXiv:2504.01211v1 公布类型: 新闻
摘要: 在本文中,我们将贝叶斯说服框架扩展以考虑发送者-接收者交互中的未观察到的混杂变量。传统模型假设信念更新遵循贝叶斯原则,但在现实世界场景中,隐藏变量会影响接收者信念形成和决策过程。我们将此概念化为一个顺序决策问题,在此过程中,发送者和接收者在多个轮次中相互作用。在每一轮中,发送者与接收者沟通,接收者也与环境互动。关键在于接收者的信念更新受到一个未观察到的混杂变量的影响。通过将以这种方式重新形式化的场景构建成部分可观测马尔可夫决策过程(POMDP),我们捕捉到发送者对于接收者信念动态和未观察混杂变量的不完整信息。我们证明,在这个POMDP中找到基于观察的最优策略等价于在原始说服框架中寻找最优信号策略。此外,我们展示了这种重新形式化如何促进说服过程中离策略评估的近端学习应用。这种进展使发送者能够仅使用行为策略下的观察数据来评估替代信号策略,从而无需进行成本高昂的新实验。
arXiv:2504.01154v1 宣告类型: 新
摘要:多代理环境中的动态资源分配通常需要在时间上平衡效率与公平性——这一挑战尚未被传统的短视公平性衡量标准充分解决。受公平性判断随着时间距离变化的人类行为洞察的启发,我们引入了一种新颖的时间公平性框架,结合了过去的折扣机制。通过应用可调的折扣因子来折旧历史效用,我们的方法在瞬时公平性和完美记忆公平性之间进行插值,从而捕获了即时结果和长期公平性的考虑。除了更贴近人类对公平性的感知外,这种方法还确保扩展的状态空间保持有界,从而在顺序决策制定环境中显著提高计算可行性。我们详细阐述了折扣记忆公平性的公式化,在增量效用和平均效用的上下文中进行了说明,并通过实用案例展示其优点,探讨了其在设计平衡和可扩展资源分配策略方面的意义。
arXiv:2503.24305v2 Announce Type: replace-cross
摘要:小分子在生物医学、环境和农化领域中扮演着关键角色,每个领域都有独特的物理化学要求和成功标准。尽管生物医学研究得益于大量数据集和成熟的基准测试,但农化数据仍然稀缺,特别是在物种特异性毒性的方面。这项工作重点关注ApisTox,这是迄今最全面的实验验证的化学毒性数据库,涉及对蜜蜂(Apis mellifera)的毒性,蜜蜂是生态上至关重要的传粉者。我们使用多种机器学习方法来评估ApisTox,包括分子指纹、图核和图神经网络,以及预训练模型。与MoleculeNet基准测试中的医学数据集的比较分析表明,ApisTox代表了一种独特的化学空间。在非医学数据集,如ApisTox上的性能下降表明,当前仅在生物医学数据上训练的最先进的算法的泛化能力有限。我们的研究强调了需要更多样化的数据集,并且针对农化领域的目标模型开发的需求。
arXiv:2503.24270v2 Announce Type: replace-cross
摘要:物体被敲击时会发出不同的声音,人类可以根据物体的外观和材料特性直观地推断它可能出现的声音。受这一直觉的启发,我们提出了Visual Acoustic Fields框架,该框架通过3D Gaussian Splatting(3DGS)在三维空间内将敲击声与视觉信号联系起来。我们的方法包含两个关键模块:声音生成和声音定位。声音生成模块利用条件扩散模型,该模型通过特征增强的3DGS渲染的多尺度特征来生成逼真的敲击声。同时,声音定位模块能够查询由特征增强的3DGS表示的三维场景,从而根据声源定位敲击位置。为了支持这一框架,我们引入了一个新的数据收集管道,用于收集场景级别的视觉-声音样本对,实现了采集图像、撞击位置及其对应声音之间的对齐。据我们所知,这是第一个在三维场景下将视觉信号和声学信号连接起来的数据集。我们数据集上的大量实验展示了Visual Acoustic Fields在生成合理的撞击声和准确定位撞击来源方面的有效性。我们的项目页面位于 https://yuelei0428.github.io/projects/Visual-Acoustic-Fields/。
arXiv:2503.23862v2 宣布类型: replace-cross
摘要:数字病理图像在医学诊断中发挥着重要作用,但由于其超高的分辨率和庞大的文件大小,存储、传输和实时可视化存在重大挑战。为解决这些问题,我们提出了一种名为CLERIC的新型深度学习基于的图像压缩框架,专门用于全切片图像(WSIs)。CLERIC结合了一个可学习的提升方案和先进的卷积技术,以提高压缩效率并保留关键的病理细节。我们的框架在分析阶段采用提升方案变换将图像分解为低频和高频分量,从而实现更加结构化的潜在表示。这些成分通过并行编码器进行处理,结合变形残差块(DRB)和递归残差块(R2B),以提高特征提取和空间适应性。合成阶段应用反提升变换进行有效的图像重建,确保高保真的细微组织结构恢复。我们使用数字病理图像数据集评估了CLERIC,并将其性能与最先进的学习图像压缩(LIC)模型进行了比较。实验结果表明,CLERIC在率失真(RD)性能上表现出色,显著减少了存储要求,同时保持高质量的诊断图像。我们的研究强调了基于深度学习的压缩在数字病理学领域的潜力,有助于实现高效的数据管理和长期存储,同时确保与临床工作流程和AI辅助诊断系统的无缝集成。代码和模型可在以下链接获取:https://github.com/pnu-amilab/CLERIC。
arXiv:2503.23820v2 通知类型: 替换-交叉
摘要:反事实推理是人类认知和决策的基础,被视为因果学习的“圣杯”,其应用范围从解释机器学习模型到促进算法公平性。尽管反事实推理在因果模型已明确定义的背景下得到了广泛研究,但在现实世界的因果建模中,模型和参数不确定性、观察噪声以及混沌行为往往是障碍。在这些背景下对反事实分析的可靠性研究仍然鲜有探索。在这项工作中,我们研究了在结构因果模型框架下反事实推理的局限性。具体地,我们通过实证研究了反事实序列估计,并指出了其中变得越来越不可靠的案例。我们发现,如模型不确定性低或动态混沌等现实假设可能会导致反直觉的结果,包括预测和真实反事实轨迹之间剧烈的偏差。本工作在混沌和不确定性特征鲜明的背景下使用反事实推理时警告要谨慎。此外,它还提出了一种是否某些系统可能对回答其行为的反事实问题具有根本性的限制的问题。
arXiv:2503.23764v2 宣告类型: replace-cross
摘要:基于Transformer的架构通过有效地建模长距离依赖性,推进了医学图像分析的发展,但在3D设置中常常由于巨大的内存开销和对细粒度局部特征不足的捕捉而遇到困难。我们通过WaveFormer这一新颖的3D变压器解决这些限制:i)利用特征在频域的基本属性进行上下文表示;ii)受到人类视觉识别系统自上而下机制的启发,这是一种生物学上合理的设计。通过在多个尺度上使用离散小波变换(DWT),WaveFormer同时保留了全局上下文和高频率细节,用高效的波特定理总结和重构替代了耗重的上采样层。这显著减少了参数数量,这对于计算资源和训练时间受限的实际部署场景至关重要。此外,该模型具有通用性且易于适应多种应用。在BraTS2023、FLARE2021和KiTS2023上的评估显示,其性能与最先进的方法持平,同时提供显著更低的计算复杂度。
arXiv:2503.23536v2 宣传类型: 交叉替换
摘要:无法学习的数据(Unlearnable Data, ULD)作为一种创新的防御技术,通过阻止机器学习模型从特定数据中学习有意义的模式来保护数据隐私和安全。通过在训练数据中引入扰动,ULD 降低了模型性能,使得未经授权的模型难以提取有用的信息表示。尽管ULD的重要性日益增加,但现有的综述主要集中在相关领域,如对抗攻击和机器去学习上,很少关注ULD作为一个独立的研究领域。本综述填补了这一空白,提供了一篇全面的ULD综述,探讨了不可学习数据生成方法、公开基准测试、评估指标、理论基础和实际应用。我们比较了不同的ULD方法,分析了它们在不可学习性、不可感知性、效率和鲁棒性方面的优势、局限性和权衡。此外,我们还讨论了关键挑战,如在不可感知性与模型性能降低之间平衡、以及生成ULD的计算复杂性。最后,我们指出了未来研究的有希望的方向,以提高ULD的有效性和应用性,突显了它在机器学习不断发展保护格局中成为重要工具的潜力。
arXiv:2503.23157v2 通知类型: 替换-交叉
摘要:文本到SQL是一个涉及多个推理密集型子任务的挑战性任务,包括自然语言理解、数据库模式理解以及精确的SQL查询制定。现有的方法往往依赖于手工设计的推理路径,具有诱导偏见,这可能会限制它们的整体有效性。受近年来诸如DeepSeek R1和OpenAI o1等增强推理模型的成功启发,这些模型通过奖励驱动的自我探索有效提升了推理能力和泛化能力,我们提出了一套针对文本到SQL任务的新型部分奖励。我们的奖励集包括模式链接、AI反馈、n-克_variation相似度和语法检测,明确设计以解决强化学习(RL)中普遍存在的奖励稀疏问题。利用分组相对策略优化(GRPO),我们的方法明确鼓励大型语言模型(LLMs)发展必要的内在推理技能,以实现精确的SQL查询生成。通过不同规模的模型我们展示了,使用我们提出的奖励进行仅RL训练相对于监督微调(SFT)在准确性和泛化能力上具有显着优势。令人惊讶的是,在BIRD基准测试中,我们的RL训练14B参数模型相比更大规模的私有模型(如o3-mini和Gemini-1.5-Pro-002)分别取得了4%和3%的显著性能提升。这些结果突显了我们提出的部分奖励强化学习训练框架在提高文本到SQL任务的准确性和推理能力方面的有效性。