arXiv 论文列表

作者: Alexander Rubinstein, Ameya Prabhu, Matthias Bethge, Seong Joon Oh

arXiv:2504.07092v2 宣告类型: 替换-交叉摘要：对象中心学习（OCL）寻求学习仅编码对象的表示，而不受场景中其他对象或背景提示的影响。这种方法支持各种目标，包括跨分布（OOD）泛化、样本高效组合以及结构化环境建模。大多数研究集中在开发无监督机制，将对象在表示空间中分离为离散槽，通过无监督对象发现进行评估。然而，随着最近的样本高效分割模型，我们可以在像素空间中分离对象并独立编码它们。这在OOD对象发现基准上实现了令人瞩目的零样本性能，并且可以实现到基础模型，并且可以处理任意数量的槽。因此，OCL方法获取对象中心表示的目标已基本实现。尽管取得了这些进展，仍存在一个关键问题：场景中分离对象的能力如何有助于更广泛的OCL目标，如OOD泛化？我们通过利用OCL的视角来研究由于虚假背景提示引起的OOD泛化挑战，来解决这个问题。我们提出了一种新的、无需训练的探测器，称为与应用掩码的对象中心分类（OCCAM），证明基于分割的个体对象编码显著优于基于槽的OCL方法。然而，在实际应用中仍存在挑战。我们为OCL社区提供了可扩展的对象中心表示工具箱，并专注于实际应用和根本问题，如理解人类认知中的对象感知。我们的代码可在以下链接获取：https://github.com/AlexanderRubinstein/OCCAM。

发布时间: 4/14/2025

查看原文

基于自我监督的太空物体行为特征化框架

作者: Ian Groves, Andrew Campbell, James Fernandes, Diego Ram\'irez Rodr\'iguez, Paul Murray, Massimiliano Vasile, Victoria Nockles

arXiv:2504.06176v2 宣告类型: replace-cross 摘要：基于模型（Foundation Models）在特定任务的微调之前，预先在大规模未标记数据集上进行训练，现在越来越多地应用于专门领域。最近的示例包括用于气候变化的ClimaX和用于卫星地球观测的Clay，但尚未开发出用于太空物体行为分析的基于模型。随着轨道物体数量的增长，对太空物体行为进行自动表征的方法对于太空安全至关重要。我们提出了一种基于模型，专注于使用光曲线（LCs）进行太空物体行为分析的空间安全与可持续性基础模型。我们实现了一个Perceiver-变分自动编码器（VAE）架构，使用自我监督重构和掩码重构在来自MMT-9观测站的227,000条LCs上进行预训练。VAE能够进行异常检测、运动预测和光曲线生成。我们分别使用CASSANDRA和GRIAL两个独立的LC模拟器对模型进行了微调，使用箱子翼、Sentinel-3、SMOS和Starlink平台的CAD模型。我们预训练的模型实现了0.01%的重构误差，通过重构难度识别出潜在的异常光曲线。经过微调后，该模型在异常检测和运动模式预测（如对日定向、旋转等）方面的准确率分别为88%和82%，分别为0.90和0.95的ROC AUC分数。对真实数据的高置信度异常预测分析揭示了包括特征物体轮廓和卫星反光在内的独特模式。在这里，我们展示了自我监督学习如何能够同时实现异常检测、运动预测和从预训练中学习的丰富表示生成合成数据的能力。因此，我们的工作通过自动化监测和模拟能力来支持太空安全与可持续发展。

发布时间: 4/14/2025

查看原文

AROMA：自主秩一矩阵适应

作者: Hao Nan Sheng, Zhi-yong Wang, Mingrui Yang, Hing Cheung So

arXiv:2504.05343v2 宣告类型: 替换交叉摘要：随着大规模语言模型不断增长，参数高效微调（PEFT）变得越来越关键。虽然低秩适应（LoRA）通过低秩更新提供了解决方案，但由于其静态秩分配可能导致结果次优，AdaLoRA在动态分配方面有所改进，但仍对初始和目标秩配置敏感。我们引入了AROMA框架，该框架通过迭代构建少量可训练参数的秩一组件，并逐渐减少到零来自动构建层特定的更新。与现有方法使用秩减少机制不同，AROMA引入了秩增长的双环架构。内部循环从每个秩一子空间提取信息，而外部循环决定秩一子空间的数量，即最优秩。我们重置优化器状态以保持子空间的独立性。与LoRA和AdaLoRA相比，AROMA显著减少了参数数量，并在自然语言理解和常识推理任务上实现了更优的性能，为自适应PEFT提供了新的见解。代码可在 https://github.com/ShuDun23/AROMA 获取。

发布时间: 4/14/2025

查看原文

带有随机变量的环境的强化学习方法：基于决策的双重评论网络 proximal 策略优化算法

作者: Leonardo Kanashiro Felizardo, Edoardo Fadda, Paolo Brandimarte, Emilio Del-Moral-Hernandez, Mari\'a Cristina Vasconcelos Nascimento

arXiv:2504.05150v2 Announce Type: replace-cross 摘要：本文提出了后决策近端策略优化（Post-Decision Proximal Policy Optimization，PDPPO），这是一种对当前领先的深度强化学习方法——近端策略优化（Proximal Policy Optimization，PPO）的新变种。PDPPO的状态转换过程分为两个步骤：一个确定性步骤，导致后决策状态；一个随机步骤，导致下一个状态。我们的方法结合了后决策状态和双重评论家，以降低问题的维度并提高价值函数估计的准确性。批量大小是指令批次优化问题，我们以此为例来说明这种动态。批量大小的目标是在不确定的需求和成本参数下，优化生产、交付履行和库存水平。本文评估了PDPPO在各种环境和配置中的性能。值得注意的是，在特定场景中，PDPPO与双重评论家结构相比，几乎可以达到 vanilla PPO 的最大奖励的两倍，需要更少的回合迭代，并且在不同的初始条件下表现出更快且更一致的学习速度。平均而言，在状态转换具有随机性特征的环境中，PDPPO 比 PPO 表现更好。这些结果支持使用后决策状态的好处。将这种后决策状态集成到价值函数逼近中，可以在高维和随机环境中实现更加明智和高效的学习。

发布时间: 4/14/2025

查看原文

SCAM：多模态基础模型在现实世界 typographic robustness 评估

作者: Justus Westerhoff, Erblina Purelku, Jakob Hackstein, Leo Pinetzki, Lorenz Hufe

arXiv:2504.04893v2 宣告类型: 替换-交叉摘要：版式攻击利用了多模态基础模型中文本和视觉内容之间的相互作用，当在图像中嵌入误导性文本时，会导致分类错误。然而，现有的数据集在规模和多样性方面存在限制，使得研究此类漏洞变得困难。本文中，我们介绍了迄今为止最大的也是最多样化的现实世界版式攻击图像数据集SCAM，包含1,162张图像，覆盖数百个物体类别和攻击词。通过对SCAM进行广泛的视觉-语言模型（VLM）基准测试，我们证明了版式攻击显著降低了性能，并确定训练数据和模型架构影响这些攻击的易感性。我们的研究表明，由于选择的视觉编码器，当今最先进的大型视觉-语言模型（LVLM）中的版式攻击仍然存在，尽管较大的大型语言模型（LLM）架构有助于减轻这种脆弱性。此外，我们展示了合成攻击与现实世界的（手写）攻击非常相似，验证了它们在研究中的使用。我们的工作提供了全面的资源和实证见解，以促进未来研究，以开发健壮和可信赖的多模态AI系统。我们已将本文中介绍的数据集公开发布在https://huggingface.co/datasets/BLISS-e-V/SCAM上，并在https://github.com/Bliss-e-V/SCAM上提供了评估代码。

发布时间: 4/14/2025

查看原文

OLAF: 一种由大型语言模型驱动的对话生物信息学开放生命科学分析框架

作者: Dylan Riffle, Nima Shirooni, Cody He, Manush Murali, Sovit Nayak, Rishikumar Gopalan, Diego Gonzalez Lopez

arXiv:2504.03976v2 宣告类型: replace-cross 摘要: OLAF（开放生命科学分析框架）是一个开源平台，使研究人员能够使用自然语言进行生物信息学分析。通过将大型语言模型（LLMs）与模块化代理-管道-路由器架构结合使用，OLAF在真实科学数据上生成和执行生物信息学代码，包括.h5ad等格式的数据。该系统包括一个基于 Angular 的前端和一个 Python/Firebase 后端，允许用户通过简单的网页界面运行如单细胞 RNA 测序工作流程、基因注释和数据可视化等内容。与通用人工智能工具不同，OLAF在可重复且用户友好的环境中集成了代码执行、数据处理和科学库。它旨在降低非编程人员参与计算生物学的门槛，并支持透明的人工智能驱动的生命科学研究。

发布时间: 4/14/2025

查看原文

MCP 安全审核：带有模型上下文协议的LLMs允许重大安全 exploit

作者: Brandon Radosevich, John Halloran

arXiv:2504.03767v2 更新类型: 替换-交叉检查摘要: 为了减少开发成本并使任何形式的生成AI应用程序中的潜在组件能够无缝集成，Model Context Protocol (MCP)（Anthropic, 2024）最近已发布并广泛采用。MCP 是一个开放协议，标准化了对大型语言模型（LLMs）、数据源和代理工具的 API 调用。通过连接多个 MCP 服务器，每台服务器都定义了一组工具、资源和提示，用户可以定义完全由 LLM 驱动的自动化工作流。然而，我们展示了当前 MCP 设计对终端用户存在广泛的的安全风险。特别是，我们证明了行业领先的大型语言模型可能被诱导使用 MCP 工具，通过各种攻击（如恶意代码执行、远程访问控制和凭证窃取）来侵害AI开发者的系统。为了积极缓解这些相关攻击，我们引入了一个安全审计工具 MCPSafetyScanner，这是第一个评估任意 MCP 服务器安全性的代理工具。MCPScanner 使用多个代理：（a）根据 MCP 服务器的工具和资源自动确定对抗样本；（b）根据这些样本搜索相关漏洞和补救措施；（c）生成一份详细记录所有发现的安全报告。我们的研究突显了一般用途代理工作流中严重安全问题，同时也提供了一个主动工具来审核 MCP 服务器的安全性，并在部署前解决检测到的漏洞。所描述的 MCP 服务器审计工具 MCPSafetyScanner 可在以下网址免费获取：https://github.com/johnhalloran321/mcpSafetyScanner

发布时间: 4/14/2025

查看原文

如果你搜索就抓住我：当基于上下文的网页搜索结果影响幻觉检测时

作者: Mahjabin Nahar, Eun-Ju Lee, Jin Won Park, Dongwon Lee

arXiv:2504.01153v2 通告类型：替换-交叉摘要：随着我们越来越多地依赖大型语言模型（LLMs）完成各种任务，这些模型被已知会产生不准确的内容或“幻觉”，这可能导致灾难性的后果。最近将网络搜索结果整合到LLMs中，引发了人们是否会利用这些结果来验证生成的内容以避免落入幻觉的陷阱的问题。这项研究（N=560）调查了提供搜索结果（无论是静态的（固定搜索结果）还是动态的（参与者驱动的搜索））如何影响参与者对LLM生成内容（即真实的、轻微的幻觉、重大的幻觉）的评估准确性和信心，与对照组（没有搜索结果）的情况相比。研究结果表明，与对照组相比，处于静态和动态条件下的参与者认为幻觉内容的准确性较低。然而，在动态条件下，参与者认为真实内容的准确性更高，并且在评估方面的总体信心也更强，这与静态或对照条件下的参与者有所不同。此外，好奇心需求较高（NFC）的参与者认为重大的幻觉内容的准确性较低，而对真实内容和轻微幻觉内容没有相应的不同。这些结果强调了将在网络搜索结果整合到LLMs中以检测幻觉的潜在益处，以及在开发以人为中心的系统时需要采取更细致的方法，考虑到用户特征。

发布时间: 4/14/2025

查看原文

Late Breaking Results：打破对称性-使用多级多代理强化学习的非常规模拟电路布局

作者: Supriyo Maji, Linran Zhao, Souradip Poddar, David Z. Pan

arXiv:2503.22958v3 宣告类型: replace-cross 摘要：布局依赖效应（LDE）显著影响模拟电路性能。传统上，设计人员依赖电路组件的对称布局来减轻由LDE引起的变异性。然而，由于这些效应的非线性性质，传统方法往往难以奏效。我们提出了一种以目标为导向、多层次、多智能体Q学习框架，以探索模拟布局的非传统设计空间，为优化模拟电路性能开辟了新的途径。我们的方法在变异性性能方面优于最先进的布局技术。值得注意的是，这是多智能体RL首次应用于模拟布局自动化。我们还对比了该提出的基于模拟退火的非ML方法。

发布时间: 4/14/2025

查看原文

国家安全部门可以利用事件机制应对AI威胁

作者: Alejandro Ortega

arXiv:2503.19887v3 安全类型: 替换-交叉摘要： recent 进展在AI能力方面的进步已经加剧了对AI系统可能对国家安全构成威胁的担忧，例如，使恶意行为者更容易对关键国家基础设施进行网络攻击，或通过失去对自主AI系统的控制。与此同时，美国联邦立法者提出了初步的‘AI事件制度’，旨在识别和应对类似威胁。在本文中，我们整合了这两种趋势，并提出了一项及时的、立法强制的AI部署后事件制度提案，旨在应对来自AI系统的潜在国家安全威胁。我们首先在论文中引入了‘安全性关键’概念，用于描述对国家安全构成极端风险的医生，然后指出‘安全性关键’描述了民用核能、航空、生命科学双重用途研究中的关注事项，以及前沿AI发展。然后我们详细阐述了我们的AI事件制度提案，通过将其与美国其他‘安全性关键’部门的国内事件制度相似性进行证明，来为提案中的每个组成部分提供合理性的说明。最后，我们勾勒了一个假设情景，在该情景中，我们提出的AI事件制度处理一次AI网络攻击事件。我们提出的AI事件制度被划分为三个阶段。第一个阶段围绕着对‘AI事件’的新定义进行操作，我们建议AI提供商在部署前沿AI系统之前必须创建一个‘国家安全案例’。第二和第三个阶段规定，AI提供商应向政府部门报告事件，政府机构应在修订AI提供商的安全和安全程序方面发挥作用，以应对未来对国家安全的威胁。

发布时间: 4/14/2025

查看原文