arXiv:2504.03759v1 声明类型:交叉
摘要:以大型语言模型(LLMs)为基础的AI代理在应对医疗和卫生挑战方面表现出高度的自主性。凭借访问各种工具的能力,它们可以在无限的动作空间内运作。然而,随着自主性和能力的增加,也带来了意想不到的风险。在本文中,我们调查了一种特定的风险,即医疗AI代理的网络安全攻击风险,因为代理可以通过网页浏览工具访问互联网。我们发现,通过嵌入在网页中的对抗性提示,网络攻击者可以:i) 向代理的回应中注入虚假信息;ii) 强迫代理操纵推荐(例如,医疗产品和服务);iii) 攻击者还可以窃取用户与代理之间的历史对话,导致敏感/私密医疗信息的泄露;iv) 进一步来说,受目标攻击的代理在回应中返回恶意URL,还可能导致计算机系统的劫持。不同基础的LLMs进行了检验,我们发现,大多数主流LLMs驱动的代理都可能遭受这些网络攻击,其中基于DeepSeek-R1的推理模型最为脆弱。
arXiv:2504.03755v1 Announce Type: 剪裁
摘要:通用类别发现(GCD)是一个实用但尚未充分探索的问题,要求模型通过利用旧类别标记样本来自动聚类和发现新的类别。面临的挑战是未标记数据中包含旧类和新类。早期利用伪标签结合参数分类器的工作分别处理旧类和新类,这导致二者之间不平衡的准确率。最近采用对比学习的方法忽略了潜在的正样本,并且与聚类目标脱钩,导致偏向的表示和次优的结果。为了解决这些问题,我们引入了一个统一且无偏的原型学习框架,即ProtoGCD,在该框架中,旧类和新类通过联合原型和统一的学习目标进行建模,从而在旧类和新类之间实现统一建模。具体而言,我们提出了一种双重适应性伪标签机制以缓解确认偏差,并结合两种正则化项共同帮助学习更适合的表示以用于GCD。此外,为了实际考虑,我们设计了一个准则来估算新类的数量。同时,我们将ProtoGCD扩展以检测未见过的异常值,实现了任务级别的统一。全面的实验表明,ProtoGCD在通用和细粒度数据集上均实现了最先进的性能。代码可在https://github.com/mashijie1028/ProtoGCD获取。
arXiv:2504.03752v1 宣传类型:交叉
摘要:生成式 AI 的迅猛发展导致互联网上充斥着大量无需人类干预便生成的合成内容,包括文本、图像、音频和视频。随着人类生成数据与 AI 生成数据之间的区别变得模糊,验证内容来源的能力对于社交媒体、新闻业、法律和金融系统等应用变得至关重要。
在本文中,我们提出了一种概念性的、多层次的架构框架,该框架使电信网络能够作为基础设施级别的内容来源认证者。通过在物理层利用身份锚定,在网络和传输层利用元数据传播,在会话和应用层利用加密验证,电信公司可以为通过其网络传输的数据提供端到端的人类来源证明。
我们阐明了每个 OSI 层如何通过技术原语(如 SIM/eSIM 身份、数字签名、基于行为的机器学习启发式方法和边缘验证的 API)对这一信任织网做出贡献。该框架作为未来实施的基础,突出了电信公司利用信任即服务 API、来源认证的流量层级和合规工具等方式实现货币化的途径。
该论文未呈现实施或基准测试结果,而是提供了一条技术详细的道路图和战略理由,旨在将电信公司转变为在 AI 占主导地位的互联网环境中验证数字真实性的验证者。安全、隐私和对抗性考量作为未来工作的方向进行了讨论。
arXiv:2504.03748v1 Announce Type: cross
摘要:视觉-语言模型(VLMs)的快速兴起极大地推进了跨模态理解的发展,使其在场景理解和视觉推理方面得到广泛应用。尽管这些模型主要在前视图像理解方面得到评估和开发,但对于顶视图像的解读能力却受到较少的关注,部分原因是缺少多样化的顶视数据集以及采集此类数据的挑战。相比之下,顶视视觉提供了明确的空间概览和场景上下文理解的改进,使其特别适用于自动驾驶导航、航空成像和空间规划等任务。为弥补这一空白,本文介绍了TDBench,一个全面的VLM顶视图像理解基准。TDBench从公共顶视视角数据集和高质量的模拟图像构建而成,包括多样化的现实世界和合成场景。TDBench包括图像理解十种评估维度的视觉问题-答案对。此外,我们还进行了四个常见的现实世界案例研究,但在现实世界中却较少被探索。通过评估结果揭示现有VLM的优点和局限性,我们希望通过TDBench为未来的研究提供启发。项目主页:https://github.com/Columbia-ICSL/TDBench
arXiv:2504.03746v1 宣布类型:交叉
摘要:随着物联网(IoT)的迅速扩张,产生的数据量大到以泽字节(zettabytes)计,这要求高效的无监督学习系统。层次时序记忆(Hierarchical Temporal Memory, HTM)是无监督人工智能的第三代算法,通过对模拟神经元列进行建模,来处理和预测序列。这些神经元列可以在多个层次上记忆和推断序列。虽然多层次推断提供了强大的预测能力,但通常伴随着显著的计算开销。HTM中的序列记忆(Sequence Memory, SM)组件负责管理这些推断,由于其广泛的可编程互连而遭遇瓶颈。在许多情况下,已观察到一级时间关系对于推断已经足够,而不会造成显著的效率损失。本文介绍了一种灵感来源于脊髓工作机制的反射记忆(Reflex Memory, RM)块,旨在加速一级推断的处理。RM块相较于SM能够显著加快这些推断的速度。RM块与HTM的整合形成了加速层次时序记忆(Accelerated Hierarchical Temporal Memory, AHTM)系统,在处理重复信息方面比原始的HTM更高效,同时还支持多层次推断。实验结果显示,HTM预测事件所需时间为0.945秒,而AHTM模块只需要0.125秒。此外,将RM硬件实现为内容地址可寻址内存(content-addressable memory, CAM)块,从而形成的硬件加速层次时序记忆(Hardware-Accelerated Hierarchical Temporal Memory, H-AHTM)在预测事件时只需要0.094秒,显著提高了推断速度。与原始算法[1]相比,AHTM将推断加速了7.55倍,而H-AHTM进一步提升了性能,实现了10.10倍的速度提升。
arXiv:2504.03744v1 交叉类型
摘要:本文介绍了多输出局部叙事解释(MOLONE),这是一种新颖的比较解释方法,旨在增强人类在环偏好贝叶斯优化(PBO)中的偏好选择。PBO中的偏好获取是一个非平凡的任务,因为它涉及在向量值结果、决策者主观优先级以及决策者在偏好选择中的不确定性之间导航隐含的权衡。现有的可解释人工智能(XAI)方法主要集中在输入特征的重要性上,忽视了输出(目标)在人类偏好获取中的关键作用。MOLONE通过提供同时强调输入和输出重要性的解释来弥补这一不足,这使得决策者能够理解竞争目标之间的权衡,并做出更为明智的偏好选择。MOLONE关注局部解释,在搜索空间内的局部邻域中对比候选样本的输入特征和结果的重要性,从而捕捉到与基于偏好的决策相关细微的差异。我们使用基准多目标优化函数在PBO框架下评估MOLONE,展示了它在与噪声偏好选择相比时改善收敛效果的有效性。此外,用户研究证实,在人类在环场景中,MOLONE显著加速了收敛过程,通过更有效地识别首选方案。
arXiv:2504.03743v1 类别: 交叉学科
摘要: 通过信息受限处理来建模有限理性决策提供了一种在强化学习框架内表示理性偏差的原理性方法,同时仍然将决策视为一个优化过程。然而,现有的方法通常基于熵、克里普克-莱布勒散度或互信息。在本工作中,我们指出了这些方法在处理序贯动作空间时存在的问题。具体而言,熵假设均匀先验信念,忽略了先验偏见对决策的影响。克里普克-莱布勒散度解决了这个问题,但它没有“动作之间的相近性”概念,并且还具有诸如缺少对称性等众所周知的潜在不利性质,而且还需要分布具有相同的支撑(例如,所有动作的正概率)。互信息通常难以估计。这里,我们提出了一种基于沃賈夫斯基距离的方法来建模有限理性强化学习代理。这种方法克服了上述问题。更重要的是,这种方法考虑了序贯动作之间的相近性,模拟了代理决策中的“粘性”和快速切换到远处动作的不真实性,同时支持低概率动作、零支撑先验分布,并且可以直接简单地计算。
arXiv:2504.03742v1 通知类型: 交叉
摘要:随着互联网流量的快速增长,恶意网络攻击变得越来越频繁和复杂,对全球网络安全构成了重大威胁。传统的检测方法,包括基于规则和基于机器学习的方法,在样本有限的情况下难以准确识别新兴威胁。尽管最近在少样本学习领域的进展在部分上解决了数据稀缺性问题,但现有方法仍表现出高的假阳性率,并缺乏捕捉关键局部流量模式的能力。在本文中,我们提出了HLoG,一种新颖的分级少样本恶意流量检测框架,该框架利用从网络会话中提取的局部和全局特征。HLoG 采用滑动窗口方法将会话分割成阶段,通过分层双向 GRU 编码捕获精细粒度的局部交互模式,同时建模全局上下文依赖关系。我们进一步设计了一个会话相似性评估模块,该模块将局部相似性与全局自注意力增强表示结合,实现准确而鲁棒的少样本流量分类。在三个精心重构的数据集上的全面实验表明,HLoG 显著优于现有最先进的方法。特别是,HLoG 在保持较低假阳性率的同时实现了较高的召回率,突显了其在实际网络安全应用中的有效性和实用价值。
arXiv:2504.03740v1 交叉类型:综合
摘要:功能性脑网络的动态表征对于阐明人类大脑功能的机制具有重要意义。尽管图神经网络在功能性网络分析中取得了显著进展,但数据稀缺和监督不足等问题仍然存在。为了解决有限训练数据和不足监督的限制,本文提出了一种名为PHGCL-DDGformer的新模型,该模型将图对比学习与图变压器相结合,有效地增强了脑网络分类任务中的表示学习能力。为了克服现有图对比学习方法在脑网络特征提取方面的约束,实施了一种结合属性掩蔽和边扰动的自适应图增强策略,以增强数据。随后,构建了一个双领域图变压器(DDGformer)模块,以结合局部和全局信息,其中图卷积网络聚合邻域特征以捕捉局部模式,而注意力机制则提取全局依赖性。最后,建立了一个图对比学习框架,以最大化正负样本对之间的一致性,从而获得高质量的图表示。实验证明,PHGCL-DDGformer模型在脑网络分类任务中优于现有最先进的方法。
arXiv:2504.03739v1 交叉类型公告
摘要:生成模型,例如GPT和BERT,在文本生成和总结等任务中显著提高了性能。然而,在较小规模的架构中,“模型生成非事实或误导性内容的现象”尤其问题重重,限制了它们的实际应用。在本文中,我们提出了一种统一的虚拟混合专家(MoE)融合策略,在不增加参数数量的情况下,增强了单个Qwen 1.5 0.5B模型的推理性能并减轻了幻觉。我们的方法利用多个领域特定的专家提示(专家的数量可调整),从不同角度引导模型。我们基于均值和标准差采用统计离群值截断策略来过滤异常高的概率预测,并在嵌入空间中注入噪声以促进输出多样性。为了明确评估每个模块的贡献,我们采用固定投票机制而非动态门控网络,从而避免了额外的混杂因素。从统计和集成学习的角度提供了详细的理论推导,以展示我们的方法如何降低输出方差并抑制幻觉。通过对话生成任务的广泛消融实验表明,我们的方法显著提高了小模型的推理准确性和鲁棒性。此外,我们讨论了评估虚拟专家正交性的方法,并概述了使用门控网络进行动态专家权重分配的未来工作潜力。