arXiv 论文列表

作者: Zahra Atf, Peter R. Lewis

arXiv:2504.12529v1 说明类型: 新摘要：本研究批判性地检查了人工智能（AI）系统中的可解释性会自然提高用户信任这一常见假设。我们采用元分析方法，对现有文献进行了全面的考察，以探索AI可解释性与信任之间的关系。我们的分析，结合了90项研究的数据，揭示了AI系统的可解释性与用户对其的信任之间存在统计学上显著但中等程度的正相关关系。这表明虽然可解释性有助于建立信任，但它并非这一方程中的唯一或主导因素。除了对可解释人工智能（XAI）领域的学术贡献外，这项研究还突显了其更广泛的社交和技术含义，特别是在促进问责制和在医疗保健和司法等关键领域培养用户信任方面。通过对算法偏见和伦理透明度等挑战的应对，该研究强调了实现公平和可持续人工智能采纳的必要性。我们更强调在AI系统中培养真实而持久的信任的重要性，而不是仅仅关注即时的信任。

发布时间: 4/18/2025

查看原文

基于启发式的识别和对外部于代理设计范围之外的不熟悉事件的快速响应

作者: Robert E. Wray, Steven J. Jones, John E. Laird

arXiv:2504.12497v1 类型: 新摘要: 即使在过去的训练中已经学习过，一个在开放世界中的智能体也会面临之前的经验、现有模型或策略之外的不熟悉的情况和事件。此外，智能体有时会缺乏相关的知识和/或足够的时间来评估当前情况、生成和评估选择方案，并采取一个经过深思熟虑的行动计划。智能体如何合理地应对超出其原始设计范围的情况？它如何足够快速和可靠地识别这些情况，以确定合理的、适应性的行动计划？我们确定了所需的关键特征，并根据这些要求评估了现有的方法，提出了一种新的方法来结合一般领域的元知识（以受人类认知启发的评估形式）和元推理。这种方法有可能提供对不熟悉情况的快速、适应性的响应，更加全面地满足开放世界和通用智能体所需的性能特征。

发布时间: 4/18/2025

查看原文

代理型人工智能优化（AAIO）：它是什么是如何工作的为什么它很重要以及如何应对它

作者: Luciano Floridi, Carlotta Buttaboni, Emmie Hine, Jessica Morley, Claudio Novelli, Tyler Schroder

arXiv:2504.12482v1 宣告类型: 新摘要: 具备独立发起数字交互能力的有自身意志的 artificial intelligence (AAI) 系统的出现， necessitates 一种专门设计用于保证网站和有自身意志的 AI 系统之间无缝交互的新优化范式。本文介绍了有自身意志的 AI 优化 (AAIO) 作为一种必不可少的方法论，用于确保网站与有自身意志的 AI 系统之间有效集成。就像搜索引擎优化 (SEO) 影响了数字内容的可发现性一样，AAIO 可以定义自主 AI 代理与在线平台之间的交互。通过研究网站优化和有自身意志的 AI 成功之间的相互依存关系，本文强调了 AAIO 可以创造的良性循环。此外，本文还探讨了 AAIO 的政府监管、伦理、法律和社会影响 (GELSI)，强调建立前瞻性监管框架的必要性，以减轻潜在的负面影响。文章最后肯定了 AAIO 在自主数字代理时代作为基本数字基础设施组成部分的必要性，呼吁实现其利益的公平和包容性访问。

发布时间: 4/18/2025

查看原文

面向人类-机器协同MLOps的 Conversational AI

作者: George Fatouros, Georgios Makridis, George Kousiouris, John Soldatos, Anargyros Tsadimas, Dimosthenis Kyriazis

arXiv:2504.12477v1 宣告类型: 新摘要: 本文介绍了一种基于大规模语言模型（LLM）的对话代理系统，旨在增强机器学习运营（MLOps）中的人机协作。我们引入了Swarm Agent，这是一种可扩展的架构，通过自然语言交互整合专门的代理以创建和管理ML工作流。该系统利用了一种分层、模块化的设计，其中包括KubeFlow Pipelines (KFP) Agent用于ML流水线编排，MinIO Agent用于数据管理，以及Retrieval-Augmented Generation (RAG) Agent用于领域特定知识的集成。通过迭代的推理循环和上下文感知的处理，该系统使具有不同技术背景的用户能够发现、执行和监控ML流水线；管理和组织数据集和制品；并通过直观的对话界面访问相关文档。我们的方法解决了复杂MLOps平台（如Kubeflow）的可访问性问题，使其先进的ML工具广泛可及，同时保持了与其他平台扩展的灵活性。本文描述了该系统的架构、实现细节，并展示了这种对话MLOps助手如何降低不同技术水平的用户进入MLOps的复杂性和壁垒。

发布时间: 4/18/2025

查看原文

基于观察数据的可解释AI驱动的2型糖尿病治疗指导原则

作者: Dewang Kumar Agarwal, Dimitris J. Bertsimas

arXiv:2504.12417v1 通告类型: 新摘要: 目标: 创建精确、结构化、基于数据的2型糖尿病治疗进展指南，适用于临床应用。研究设计与方法: 我们的训练队列由1998年至2014年间波士顿医疗中心(BMC)患者的就诊记录组成。根据患者在就诊前的治疗方案，我们将就诊分成4组，并进一步根据就诊期间推荐的治疗方案将其分成子组。由于每个子组都有观察数据，这些数据存在混杂偏差（病情较重的患者会被开具更积极的治疗方案），我们使用机器学习和优化来去除一些数据点，使得剩余的数据类似于随机对照试验。在每个子组中，我们训练基于AI的树状模型以开具治疗调整建议。一旦训练这些树模型，我们手动将每组中的模型结合起来，为该组的所有患者创建一个端到端的处方管道。在这个过程中，我们优先考虑在考虑不太积极的选项之前升级到更积极的治疗方案。我们使用BMC的未见数据和哈特福德医疗保健机构的外部数据集（2020年1月至2024年5月的2型糖尿病患者就诊记录）对该管道进行了测试。结果: 与医生在BMC未见患者中的表现相比，我们管道实现的中位HbA1c降低率为0.26%。对于哈特福德队列，我们的管道表现更好，高出0.13%。结论: 这种基于AI、可解释且高效的2型糖尿病治疗进展方法预计能够超越现有实践，并可用于改善患者结果。

发布时间: 4/18/2025

查看原文

阐明多模态蛋白质语言模型的设计空间

作者: Cheng-Yen Hsieh, Xinyou Wang, Daiheng Zhang, Dongyu Xue, Fei Ye, Shujian Huang, Zaixiang Zheng, Quanquan Gu

arXiv:2504.11454v2 通告类型: replace-cross 摘要: 多模态蛋白质语言模型（PLMs）整合了序列和基于标记的结构信息，为蛋白质建模、生成和设计提供了强大的基础。然而，将3D结构划分为离散标记的方式导致了关于精细结构细节和相关性的大量失真。在本文中，我们系统地阐明了多模态PLMs的设计空间，以克服其局限性。我们确定标记化损失以及PLMs对结构标记预测的不准确性为主要瓶颈。为了解决这些问题，我们提出的创新设计空间涵盖了改进的生成建模、结构感知架构和表示学习，以及数据探索。我们的进展实现了更细粒度的监督，证明了基于标记的多模态PLMs可以在保持稳健结构建模的同时适应复杂的结构细节。有效的设计方法显著提高了结构生成的多样性，并且特别地，在PDB测试集上将RMSD从5.52降低到2.36，甚至超越了3B基线模型，与专门的折叠模型相当。

发布时间: 4/17/2025

查看原文

增强语言模型性能的高效分布式检索增强生成方法

作者: Shangyu Liu, Zhenzhe Zheng, Xiaoyao Huang, Fan Wu, Guihai Chen, Jie Wu

arXiv:2504.11197v2 通知类型: 替换-交叉摘要：小型语言模型（SLMs）支持在资源受限的边缘设备上进行高效部署，但其有限的容量会牺牲推理性能。检索增强生成（RAG）是一种通过集成外部数据库来提高模型性能的有前景的解决方案，而无需在设备上进行密集的模型重新训练。然而，大规模的公共数据库和用户的私人具体上下文文档通常位于云和设备上，而现有的RAG实现主要集中在中心化上。为了解决这一差距，我们提出了DRAGON，这是一种分布式RAG框架，通过获取通用和个性化知识在设备上增强SLM，且不泄露文档隐私。具体来说，DRAGON 将多文档RAG分解为在云和设备上独立且并行地执行的多个标记生成过程，并采用一种新设计的推测性聚合算法，以避免云和设备之间的频繁输出同步。此外引入了一种新的调度算法，根据实时网络条件确定最佳聚合侧。基于真实硬件测试床的评估表明，DRAGON在整体性能上比集中式RAG提高了最高1.9倍，显著降低了每个标记延迟，并且在首个标记时间（TTFT）上几乎没有额外开销。

发布时间: 4/17/2025

查看原文

绕过提示注入和监禁突破检测的LLM防护栏规避

作者: William Hackett, Lewis Birch, Stefan Trawicki, Neeraj Suri, Peter Garraghan

arXiv:2504.11168v2 宣告类型: replace-cross 摘要: 大型语言模型（LLMs）护栏系统旨在保护免受提示注入和 jailbreak 攻击。然而，它们仍然容易受到规避技术的攻击。我们展示了两种通过传统的字符注入方法和算法对抗机器学习（AML）规避技术来绕过 LLM 提示注入和检测系统的途径。通过针对包括 Microsoft 的 Azure Prompt Shield 和 Meta 的 Prompt Guard 在内的六种主要防护系统进行测试，我们证明这两种方法可以在不降低对抗效用的情况下被用于规避检测，某些情况下甚至实现了 100% 的规避成功率。此外，我们展示了攻击者可以通过利用来自离线白盒模型计算出的单词重要性排名来增强对黑盒目标的攻击成功率（ASR）。我们的发现揭示了当前 LLM 保护机制中的漏洞，并突显了需要更具 robust 性的护栏系统的重要性。

发布时间: 4/17/2025

查看原文

机器学习预测中的动力学错误

作者: Zhou Fang, Gianmarco Mengaldo

arXiv:2504.11074v2 预测类型: 替换-交叉摘要：在机器学习预测中，均绝对误差（MAE）和均方误差（MSE）等标准误差度量量化了预测与目标值之间的差异。然而，这些度量并不能直接评估预测的物理和/或动力学一致性，在科学和工程应用中的重要性越来越高。实际上，一个基础但经常被忽视的问题是，机器学习预测是否保持了底层系统的动力学行为。解决这个问题对于评估机器学习模型的保真度和识别潜在的失效模式至关重要，尤其是在维持正确动力学行为至关重要的应用中。在本文中，我们研究了标准预测误差度量（如MAE和MSE）与底层系统动力学性质之间的关系。为了实现这一目标，我们使用了两种最近开发的动力学指标：瞬时维度（$d$）和逆持久性（$\theta$）。我们的结果显示，更大的预测误差——例如更高的MSE——倾向于出现在更高维度（更复杂）和更高逆持久性（更低持久性）的状态中。为了进一步评估动力学一致性，我们提出了基于动力学指标的误差度量，这些度量用于测量预报的$d$和$\theta$与正确值之间的差异。利用这些基于动力学指标的度量，我们分析了洛伦兹、Kuramoto-Sivashinsky 方程和柯尔莫戈罗夫流三个经典的数据集以及现实世界的天气预报任务。我们的发现揭示了机器学习预测中动力学属性的巨大扭曲，尤其是在长时间预测或长时间递归模拟中，这些发现提供了关于机器学习预测保真度的附加信息，可以用于改进机器学习模型。

发布时间: 4/17/2025

查看原文

GATE3D：广义注意力驱动的任务协同化三维估计*

作者: Eunsoo Im, Jung Kwon Lee, Changhyun Jee

arXiv:2504.11014v2 宣告类型: replace-cross 摘要：计算机视觉领域新兴的趋势强调开发能够同时处理多种多样任务的通用模型。这种通用性通常需要在多领域数据集上进行联合训练，以确保有效的泛化。然而，由于缺乏标注有准确3D地面真值标签的数据集，特别是超越典型道路自动驾驶场景的环境，单目3D物体检测在多领域训练中面临着独特挑战。为了解决这一挑战，我们引入了一种新的弱监督框架，利用伪标签。当前的预训练模型往往在非道路环境中难以准确检测行人，原因是训练数据集存在固有的偏差。与通用的基于图像的二维物体检测模型不同，在单目3D检测中实现类似的泛化至今仍未得到充分探索。本文中，我们提出了GATE3D，这是一种专为弱监督下的通用单目3D物体检测设计的新型框架。GATE3D通过在2D和3D预测之间采用一致性损失，有效地填补了领域差距。令人惊讶的是，我们的模型在KITTI基准测试以及我们在室内办公室环境中收集的数据集上，都展现了具有竞争力的性能，用于评估我们框架的泛化能力。我们的结果表明，GATE3D通过有效的预训练策略显著加速了从有限的标注数据中学习的过程，突显了其在机器人、增强现实和虚拟现实应用领域的广泛影响潜力。项目页面: https://ies0411.github.io/GATE3D/

发布时间: 4/17/2025

查看原文