arXiv 论文列表

作者: Zeren Luo, Zifan Peng, Yule Liu, Zhen Sun, Mingchen Li, Jingyi Zheng, Xinlei He

arXiv:2502.04951v1 安全类型：横跨摘要：大型语言模型（LLMs）的最近进步显著增强了人工智能驱动的搜索引擎（AIPSEs）的能力，通过集成外部数据库和预先存在的知识，提供精准和高效的响应。然而，我们观察到这些AIPSEs存在引用恶意内容或引用恶意网站的风险，导致有害或未经验证的信息传播。在本研究中，我们通过系统地定义威胁模型、风险级别以及评估各种查询类型响应的方式，第一次对七个生产AIPSEs进行了安全性风险量化。通过从PhishTank、ThreatBook和LevelBlue收集的数据，我们的发现揭示了即使在简单的查询（例如，包含良性关键词）下，AIPSEs也会频繁生成包含恶意URL的有害内容。我们还观察到，直接查询URL会增加风险级别，而使用自然语言查询则可以减轻这种风险。我们进一步对在线文档伪造和网络钓鱼进行了两个案例研究，以展示在实际场景下欺骗AIPSEs的容易程度。为了缓解这些风险，我们开发了一种基于代理的防御措施，其中包括基于GPT-4o的内容精炼工具和基于XGBoost的URL检测器。我们的评估表明，我们的防御措施可以有效地降低风险，但会以减少可用信息为代价。我们的研究强调了在AIPSEs中实施坚实的安全措施的迫切需求。

发布时间: 2/10/2025

查看原文

数据驱动的模态融合：一种基于AI的大规模传感器网络管理框架

作者: Hrishikesh Dutta, Roberto Minerva, Maira Alvi, Noel Crespi

arXiv:2502.04937v1 交叉论文类型摘要：智能城市的开发和运营严重依赖大规模的物联网（IoT）网络和传感器基础设施，这些基础设施不断监控城市的各个方面。这些网络会产生海量数据，带来带宽使用、能源消耗和系统扩展性方面的挑战。本文提出了一种名为数据驱动模式融合（DMF）的新颖传感范式，旨在提高智能城市物联网网络管理的效率。通过利用不同传感模态时间序列数据之间的相关性，提出的DMF方法减少了用于监控的物理传感器数量，从而减少了能源消耗、通信带宽和总体部署成本。该框架将计算复杂性从边缘设备转移到核心，确保资源受限的物联网设备不会被繁重的处理任务所困扰。DMF使用马德里实际物联网部署的数据进行了验证，展示了该系统利用少数传感器精确估计交通、环境和污染指标的有效性。所提出的方法提供了一种可扩展、高效的机制来管理城市物联网网络，同时解决了传感器故障和隐私问题。

发布时间: 2/10/2025

查看原文

日-ahead和实时平衡市场电价的齐性预测方法

作者: Ciaran O'Connor, Mohamed Bahloul, Roberto Rossi, Steven Prestwich, Andrea Visentin

arXiv:2502.04935v1 Announce Type: cross 摘要：将可再生能源整合到电力市场中对电价稳定性提出了重大挑战，并增加了市场的复杂性。准确可靠的电价预测对于有效的市场参与至关重要，因为电价动态的预测更加具有挑战性。概率预测通过预测区间有效地量化了电价固有的不确定性，从而支持市场的更好决策。本文研究了使用置信预测（CP）技术提高概率价格预测的方法，特别是集成批量预测区间和序列预测置信推断。这些方法提供了精确且可靠的预测区间，在有效性指标上超过了传统的模型。我们提出了一种集成方法，将可量化回归模型的效率与时间序列适应的CP技术的稳健覆盖特性相结合。该集成方法提供了窄预测区间和高覆盖率，从而实现更可靠和准确的预测。我们进一步通过应用于电池储能系统的模拟交易算法评估了CP技术的实际影响。该集成方法在日前市场和平衡市场中均展现了改进的财务回报，突出了其对市场参与者的实际益处。

发布时间: 2/10/2025

查看原文

多概念图像生成的缓存多洛拉组成

作者: Xiandong Zou, Mingzhu Shen, Christos-Savvas Bouganis, Yiren Zhao

arXiv:2502.04923v1 宣布类型：交叉摘要：低秩适应（LoRA）已成为文本到图像模型中广泛采用的技术，使在多概念图像生成中精确渲染多种不同的元素（如角色和风格）成为可能。然而，当前的方法在组合这些LoRA进行多概念图像生成时面临着重大挑战，导致生成图像质量下降。在本文中，我们最初通过Fourier频率域的视角来调查LoRA在去噪过程中的作用。基于多应用LoRA可能导致“语义冲突”的假设，我们发现某些LoRA放大了高频特征，如边缘和纹理，而其他LoRA则主要关注低频元素，包括整体结构和光滑的颜色渐变。基于这些见解，我们设计了一种基于频域的序列策略，以确定LoRA在推理过程中应集成的最佳顺序。该策略提供了一种与现有LoRA融合技术中常见的直观集成相比更为系统和可推广的解决方案。为了充分利用我们所提出的LoRA顺序确定方法在多LoRA组合任务中的应用，我们引入了一种新的、无需训练的框架——缓存多LoRA（CMLoRA），旨在高效地结合多个LoRA同时保持图像的一致性生成。凭借其灵活的多LoRA融合骨干和针对各个LoRA定制的非均匀缓存策略，CMLoRA有望减少LoRA组合中的语义冲突并提高计算效率。我们的实验评估表明，与LoraHub、LoRA Composite和LoRA Switch等最先进的无需训练的LoRA融合方法相比，CMLoRA在CLIPScore上平均提高了2.19%，在MLLM胜率上提高了11.25%。

发布时间: 2/10/2025

查看原文

复杂物理抑制神经网络

作者: Chenhao Si, Ming Yan, Xin Li, Zhihong Xia

arXiv:2502.04917v1 类型: cross 摘要: 我们提出了一种新颖的物理输入神经网络(PINN)架构——compleX-PINN，该架构采用了由Cauchy积分定理启发的可学习激活函数。通过学习激活函数的参数，compleX-PINN仅使用一层隐藏层就能达到高精度。实验结果表明，compleX-PINN有效地解决了传统PINN难以处理的问题，并且一致地提供显著更高的精度，通常精度高出一个数量级。

发布时间: 2/10/2025

查看原文

小波辅助多频注意力网络用于融合

作者: Jie Huang, Rui Huang, Jinghao Xu, Siran Pen, Yule Duan, Liangjian Deng

arXiv:2502.04903v1 宣告类型: cross 摘要: Pansharpening 的目标是将高分辨率多光谱（PAN）图像与低分辨率多光谱（LRMS）图像相结合，生成高分辨率多光谱（HRMS）图像。尽管在频域中进行 Pansharpening 提供了明显的优势，但大多数现有方法要么仅在空间域中操作，要么未能充分利用频域的优势。为了解决这一问题，我们创新地提出了多频融合注意力（MFFA），利用小波变换清晰地分离频率，使得在不同的频域中进行无损重建成为可能。然后，我们根据不同特征所代表的物理含义生成频域查询、空间键和融合值，从而能够在频域中更有效地捕捉特定信息。此外，我们致力于在不同操作中保持频域特征的完整性。在更广阔的层面上，我们的网络采用小波金字塔，在多个尺度上逐步融合信息。与之前的频域方法相比，我们的网络在融合过程中更好地防止了不同频域特征的混淆和丢失。在多个数据集上的定量和定性实验表明，我们的方法优于现有方法，并且展示了在实际场景中的显著泛化能力。

发布时间: 2/10/2025

查看原文

统一方法在自监督事件流建模中的进展与前景

作者: Levente Z\'olyomi, Tianze Wang, Sofiane Ennadir, Oleg Smirnov, Lele Cao

arXiv:2502.04899v1 宣称类型: cross 摘要：在医疗保健、电子商务、游戏和金融等多个领域中，数字化交互的激增导致生成了大量事件流(ES)数据。ES数据包含了每个领域相关的详细上下文信息，以时间戳的形式呈现连续的事件序列。尽管ES数据具有提取可操作洞察和增强决策的潜力，但其有效利用却受到数据标注稀缺性和现有研究努力碎片化的挑战。自我监督学习（SSL）作为一种新兴范式，通过从未标注的ES数据中提取有意义的表示来应对这些挑战。在本综述中，我们系统地回顾和综合了适用于跨多个领域的ES建模的SSL方法论，弥合了传统上各自为营的领域特定方法之间的差距。我们提出了一个全面的SSL技术分类，涵盖了预测和对比学习范式，并分析了它们在不同应用场景中的适用性和有效性。此外，我们指出了当前研究中的关键缺口，并提出了一个未来研究议程，旨在开发可扩展、领域通用的SSL框架，用于ES建模。通过统一分散的研究努力并强调跨领域协同效应，本综述旨在加速创新、提高可再现性，并扩大SSL在各种实际ES挑战中的应用范围。

发布时间: 2/10/2025

查看原文

ARTInp: CBCT-to-CT图像修复和图像翻译在放疗中的应用

作者: Ricardo Coimbra Brioso, Leonardo Crespi, Andrea Seghetto, Damiano Dei, Nicola Lambri, Pietro Mancosu, Marta Scorsetti, Daniele Loiacono

arXiv:2502.04898v1 适配性放疗类型: 交叉摘要：适配性放疗（ART）工作流程中的一个关键步骤是在治疗时评估患者的解剖结构，以确保投射的准确性。为此，断层计算机锥形束成像（CBCT）广泛使用，因其经济实惠且易于集成到治疗过程中。然而，与CT扫描相比，CBCT图像的分辨率较低且含有更多伪影，这使其在精确治疗验证方面不够可靠。此外，在如全身和淋巴结照射（TMLI）等复杂治疗中，全身患者的可视化对于准确剂量投递至关重要，但由于CBCT图像经常不连续，导致可能存在有用解剖信息的空白区域。为解决这些局限性，我们提出了ARTInp（适配性放疗图像修补），这是一种结合图像修补和CBCT-to-CT转换的创新深度学习框架。ARTInp采用双重网络方法：一种完成网络，用于填充CBCT体素中的解剖学空白，并使用一种定制的生成对抗网络（GAN）生成高质量的合成CT（sCT）图像。我们在SynthRad 2023挑战赛中的CBCT和CT图像配对数据集上对ARTInp进行了训练，并在18名患者的测试集中取得的性能展示了其在放射治疗中增强基于CBCT的工作流程的潜力。

发布时间: 2/10/2025

查看原文

稀疏自动编码器不会找到 canonical 单元

作者: Patrick Leask, Bart Bussmann, Michael Pearce, Joseph Bloom, Curt Tigges, Noura Al Moubayed, Lee Sharkey, Neel Nanda

arXiv:2502.04878v1 交叉类型摘要：机制可解释性的共同目标是将神经网络的激活分解为特征：模型计算出的输入的可解释属性。稀疏自编码器（SAEs）是寻找这些特征在大语言模型（LLMs）中的流行方法，有人认为它们可以用来找到一组“标准”的单元：一个独特且完整的原子特征列表。我们通过两种新颖的技术对此信念提出质疑：SAE缝合以显示它们是不完整的，以及元SAE以显示它们不是原子的。SAE缝合涉及到将较大的SAE中的潜在变量插入到较小的SAE中，或交换它们。较大的SAE中的潜在变量可以分为两类：新颖潜在变量，当添加到较小的SAE时能提高性能，表明它们捕捉到了新颖信息；重建潜在变量，可以替换较小的SAE中具有类似行为的相应潜在变量。存在新颖特征表明较小的SAE是不完整的。使用元SAE（在另一个SAE的解码矩阵上训练的SAE）我们发现，SAE中的潜在变量通常分解为较小SAE中潜在变量的组合，显示较大的SAE潜在变量不是原子的。这些分解往往是可解释的；例如，代表“爱因斯坦”的潜在变量分解为“科学家”、“德国”和“著名人物”。即使SAE未能找到分析的标准单元，它们仍然可能成为有用的工具。我们建议未来的研究要么寻求不同方法来识别此类单元，要么实用地选择适合其任务的SAE大小。我们提供了一个交互式仪表板来探索元SAE：https://metasaes.streamlit.app/

发布时间: 2/10/2025

查看原文

$TAR^2$: 时间代理奖励重分配以在多代理强化学习中保持最优策略

作者: Aditya Kapoor, Kale-ab Tessera, Mayank Baranwal, Harshad Khadilkar, Stefano Albrecht, Mingfei Sun

arXiv:2502.04864v1 通告类型: cross 摘要：在协作多智能体强化学习（MARL）中，当全局奖励稀疏且延迟时，学习有效的策略具有挑战性。这种挑战源于需在智能体和时间步骤之间分配奖励信用，而现有方法在长时间任务中往往无法有效解决这一问题。我们提出了一种新颖的方法——临时智能体奖励重分配（Temporal-Agent Reward Redistribution, $TAR^2$），该方法将稀疏的全局奖励分解为智能体特定和时间步骤特定的组件，从而为策略学习提供更频繁和准确的反馈。理论上，我们证明了（i）$TAR^2$与基于潜力的奖励塑形一致，保留与原始环境相同的最优策略；（ii）$TAR^2$保持与原始稀疏奖励下的策略梯度更新方向相同，确保无偏的信用信号。在两个具有挑战性的基准SMACLite和Google Research Football上的实验结果表明，$TAR^2$显著稳定并加速了收敛过程，在学习速度和最终性能方面均优于AREL和STAS等强基线。这些发现确立了$TAR^2$为稀疏奖励多智能体系统中智能体-时间信用分配的一个有原则且实用的解决方案。

发布时间: 2/10/2025

查看原文