arXiv:2504.03784v1 类型: cross
摘要: 从人类反馈中强化学习(RLHF)已经成为使大型语言模型(LLMs)的输出与人类偏好相一致的关键技术。为了学习奖励函数,现有的大多数RLHF算法使用Bradley-Terry模型,该模型基于关于人类偏好的假设,而这些假设可能未能反映现实世界判断的复杂性和变化性。在这篇论文中,我们提出了一种稳健算法,以在这样的奖励模型指定不准确的情况下增强现有方法的性能。理论上,我们的算法减少了奖励和策略估计器的方差,导致改进的遗憾界。在Anthropic Helpful and Harmless数据集上的LLM基准数据集上的实证评估表明,所提出的算法在大多数情况下优于现有方法,与基线方法相比,有77-81%的响应更受欢迎。
arXiv:2504.03783v1 宣告类型: cross
摘要:联邦主动学习(FAL)作为一种框架,旨在利用分布式客户端上的大量未标记数据,同时保持数据隐私,已经开始崭露头角。然而,在真实世界的部署中,由于高标注成本和耗时的采样过程,特别是在跨数据中心(cross-silo)设置中,当客户端拥有大量本地数据集时,这样的部署仍然受到限制。本文针对关键问题进行了探讨:在最小化标注员努力的情况下,如何减少人类参与的循环学习中的通信成本?现有的FAL方法通常依赖迭代标注过程,将主动采样与联邦更新分离,导致多次昂贵的通信和标注轮次。为应对这一挑战,我们提出了一种两阶段的FAL框架(FAST),第一阶段使用基础模型进行弱标注,第二阶段专注于最不确定的样本进行细化。通过利用基础模型的表示知识并将细化步骤整合到精简的工作流程中,FAST显著降低了循环主动采样的开销。实验结果表明,在受限的5%标注预算下,FAST在多种医疗和自然图像基准测试中平均优于现有FAL方法4.36%,同时通信轮次减少了八倍。
arXiv:2504.03777v1 宣告类型: cross
摘要: 通过最近在神经网络方面的进展,如Transformer,多变量时间序列(MTS)预测取得了巨大的进步(误差几乎可以忽略不计)。然而,在像预测可能导致心理健康问题的游戏过度投入这样的关键时刻,如果没有提供相关证据(解释),一个准确的预测是无关紧要的。因此,重要的是,预测是可解释的——预报轨迹的中间表示是可以理解的;以及可解释的——关注输入特征和事件,以便对有风险的玩家进行个性化和及时的干预。虽然目前关于可解释性的最先进的研究主要集中在平滑的单一过程驱动的时间序列数据上,我们的在线多玩家游戏数据由于玩家游戏结果与进一步参与意图之间的内在正交性,展示了难以处理的时间随机性。我们提出了一种新的深度行动预测网络(AFN),该网络解决与三个独立试图实现的目标相关的相互依赖挑战——1)预报精度;2)平滑可理解的轨迹;3)通过多维输入特征提供解释,同时解决我们非平滑时间数据带来的挑战,统一在一个解决方案中。AFN 通过以下方式建立了新的基准:(i)与基于 SOM-VAE 的最新技术(SOTA)网络相比,在玩家数据的预测 MSE 上提高了 25%;(ii)将玩家时间序列的不利进展归因于特定的未来时间步长(s),假设通过特定的可操作输入特征消除未来近期的过度投入玩家数量超过 18%;(iii)比 SOTA 提前 4 周平均检测到 23%(从 SOTA 提高 100%)的即将过度投入的玩家。
arXiv:2504.03776v1 声明类型:交叉
摘要:城市空气质量的恶化需要创新的解决方案以实现实时空气质量和预测。本文介绍了一种基于TinyML的新颖系统,用于实时预测臭氧浓度。该系统利用了Arduino Nano 33 BLE Sense微控制器,配备MQ7传感器以检测一氧化碳(CO),并内置温度和压力传感器。数据来源于印度空气质量参数的Kaggle数据集,经过彻底的清洗和预处理。模型训练和评估使用Edge Impulse进行,并考虑了各种输入参数(CO、温度和压力)的不同组合。包含所有三个变量的最佳模型实现了均方误差(MSE)为0.03和R平方值为0.95,表明具有高度的预测准确性。通过Arduino IDE将回归模型部署到微控制器上,展示了强大的实时性能。敏感性分析确定了一氧化碳水平是最关键的臭氧浓度预测因子,其次是压力和温度。该系统的低成本和低功耗设计使其适用于广泛的实施,特别是在资源限制的环境中。这种TinyML方法能提供精确的实时臭氧水平预测,便于对污染事件采取及时响应,从而增强公众健康保护。
arXiv:2504.03775v1 Announce Type: cross
摘要:分散推理已成为一种关键框架,通过将大规模语言模型推理中的预填充(P)阶段和解码(D)阶段分离,以提高吞吐量。然而,预填充节点和解码节点之间 KV 缓存传输面临着显著的延迟。块级调用方法和不连续的 KV 缓存内存分配增加了传输内核的调用次数。此外,现有的框架往往固定了 P 和 D 节点的角色,导致计算不平衡。本文提出了 FlowKV,这是一种新的分散推理框架,通过优化 KV 缓存传输,将平均传输延迟降低了 96%,从 0.944s 降至 0.053s,几乎完全消除了与总请求延迟相比的传输时间。FlowKV 引入了负载感知调度器,实现了平衡的请求调度和灵活的 PD 节点分配。这种设计最大限度地利用了硬件资源,即使在正常、计算不平衡和极端过载条件下也实现了系统的峰值吞吐量。实验结果表明,与基线相比,FlowKV 在 LongBench 数据集上将推理加速了 15.2%-48.9%,并支持异构 GPU 应用。
arXiv:2504.03774v1 交叉类型:cross
摘要:在当今技术快速发展的时代,人工智能(AI)应用需要大规模、高性能和数据密集型计算,这导致了显著的能源需求。解决这一挑战需要硬件和软件创新的结合 approach。硬件制造商正在开发新的、高效且专门的解决方案,RISC-V 架构因其开放、可扩展和节能的指令集架构(ISA)而成为重要参与者。同时,软件开发者正在创建新的算法和框架,但它们的能源效率往往不明确。在这项研究中,我们对 64 核 SOPHON SG2042 RISC-V 架构上的机器学习(ML)应用进行了全面的基准分析。我们特别分析了 PyTorch、ONNX Runtime 和 TensorFlow 这三个领先 AI 框架下的深度学习推理模型的能耗。我们的研究发现,使用 XNNPACK 后端的框架,如 ONNX Runtime 和 TensorFlow,在能耗上比使用原生 OpenBLAS 后端编译的 PyTorch 更低。
arXiv:2504.03773v1 宣告类型:交叉
摘要:尽管在智能故障诊断(IFD)方面取得了显著进展,但缺乏可解释性仍然是其在工业应用中的关键障碍,推动了IFD中可解释性研究的增长。事后可解释性因其能在不修改模型结构的情况下保持网络的灵活性和扩展性而受到青睐。然而,这些方法往往在时间域解释方面效果欠佳。最近,将领域变换与SHAP相结合,通过扩展解释到更具信息量的领域来提高可解释性。尽管如此,由于领域变换增加了维度,SHAP的计算成本仍然是一个重大挑战。为了解决这个问题,我们提出了局部归属和SHapley估算解释(SHEP)。局部归属通过降低特征维度以牺牲解释粒度为代价来简化特征选择,而SHEP简化了子集枚举以近似SHAP,将复杂性从指数级降低到线性级。结合这些方法,显著提高了SHAP的计算效率,为监测任务中的实时解释提供了可行性。大量实验验证了SHEP在效率、可解释性和近似SHAP方面的可靠性和有效性。此外,开源代码使SHEP有可能成为IFD事后可解释性的基准。代码可在https://github.com/ChenQian0618/SHEP获取。
arXiv:2504.03770v1 安全类型: 横跨多个领域
摘要: 多模态大规模语言模型(MLLMs)在视觉-语言任务中表现出色,但也面临着生成有害内容的重大风险,特别是通过越狱攻击。越狱攻击是指故意操纵模型的安全机制,导致生成不适当或不安全的内容。检测这类攻击对于确保MLLMs的负责任部署至关重要。现有的越狱检测方法面临三大主要挑战:(1)许多方法依赖于模型的隐藏状态或梯度,这限制了它们在白盒模型中的应用,即模型的内部工作机制是可访问的;(2)涉及基于不确定性分析的高计算开销,这限制了实时检测;(3)需要完全标注的有害数据集,而在实际环境中这些数据集往往稀缺。为了解决这些问题,我们提出了一种基于测试时自适应框架的JAILDAM方法。我们的方法利用一种基于策略引导的不安全知识表示的内存导向方法,消除了对有害数据直接暴露的需要。通过在测试时动态更新不安全知识,我们的框架提高了对未见越狱策略的泛化能力,同时保持了效率。在多个VLM越狱基准测试上的实验表明,JAILDAM在有害内容检测方面达到了最先进的性能,提高了准确性和速度。
arXiv:2504.03767v1 类型: cross
摘要: 为了减少开发成本并使潜在组件能够无缝集成到任何给定的生成式AI应用程序中,Model Context Protocol (MCP) (Anthropic, 2024) 最近被发布并被广泛采用。MCP 是一个开放协议,标准化了对大型语言模型 (LLMs)、数据源和自主工具的 API 调用。通过连接多个 MCP 服务器,每个服务器都定义了一组工具、资源和提示,用户能够定义完全由 LLM 驱动的自动化工作流。然而,我们展示了当前 MCP 设计对终端用户存在广泛的安防风险。特别是,我们证明了行业领先的 LLM 可能会被迫使用 MCP 工具,通过各种攻击(如恶意代码执行、远程访问控制和凭证窃取)来危害 AI 开发者的系统。为了主动缓解这些和相关攻击,我们引入了一个安全性审计工具 MCPSafetyScanner,这是第一个用于评估任意 MCP 服务器安全性的自主工具。MCPScanner 使用几个代理来(a)根据 MCP 服务器的工具和资源自动确定对抗样本;(b)根据这些样本寻找相关漏洞和修复措施;以及(c)生成详细记录所有发现的安全报告。我们的工作突显了通用自主工作流中的严重安全问题,同时提供了一个主动工具来审计 MCP 服务器安全性,并在部署前解决检测到的漏洞。
描述中的 MCP 服务器审计工具 MCPSafetyScanner 完全免费获得链接如下:https://github.com/leidosinc/McpSafetyScanner
arXiv:2504.03763v1 交叉类型: 计算机科学
摘要: 电阻式内存计算(RIMC)为边缘AI提供了超高效计算,但由于时间推移下RRAM传导性漂移,导致精度下降。传统的重新训练方法受限于RRAM的高能耗、写入延迟和耐久性限制。我们提出了一种基于DoRA的校准框架,通过使用少量存储在SRAM中的校准参数补偿影响权重,从而恢复精度,而不更改RRAM权重。这种方法消除了现场RRAM写入,确保了高效、快速和可靠的校准。在基于RIMC的ResNet50(ImageNet-1K)上进行的实验表明,仅使用10个校准样本即可恢复95.47%的精度,同时更新参数的2.34%。