LLM2D

arXiv 论文列表

作者: Zeren Luo, Zifan Peng, Yule Liu, Zhen Sun, Mingchen Li, Jingyi Zheng, Xinlei He
arXiv:2502.04951v1 安全类型:横跨 摘要:大型语言模型(LLMs)的最近进步显著增强了人工智能驱动的搜索引擎(AIPSEs)的能力,通过集成外部数据库和预先存在的知识,提供精准和高效的响应。然而,我们观察到这些AIPSEs存在引用恶意内容或引用恶意网站的风险,导致有害或未经验证的信息传播。在本研究中,我们通过系统地定义威胁模型、风险级别以及评估各种查询类型响应的方式,第一次对七个生产AIPSEs进行了安全性风险量化。通过从PhishTank、ThreatBook和LevelBlue收集的数据,我们的发现揭示了即使在简单的查询(例如,包含良性关键词)下,AIPSEs也会频繁生成包含恶意URL的有害内容。我们还观察到,直接查询URL会增加风险级别,而使用自然语言查询则可以减轻这种风险。我们进一步对在线文档伪造和网络钓鱼进行了两个案例研究,以展示在实际场景下欺骗AIPSEs的容易程度。为了缓解这些风险,我们开发了一种基于代理的防御措施,其中包括基于GPT-4o的内容精炼工具和基于XGBoost的URL检测器。我们的评估表明,我们的防御措施可以有效地降低风险,但会以减少可用信息为代价。我们的研究强调了在AIPSEs中实施坚实的安全措施的迫切需求。
发布时间: 2/10/2025
查看原文
作者: Hrishikesh Dutta, Roberto Minerva, Maira Alvi, Noel Crespi
arXiv:2502.04937v1 交叉论文类型 摘要:智能城市的开发和运营严重依赖大规模的物联网(IoT)网络和传感器基础设施,这些基础设施不断监控城市的各个方面。这些网络会产生海量数据,带来带宽使用、能源消耗和系统扩展性方面的挑战。本文提出了一种名为数据驱动模式融合(DMF)的新颖传感范式,旨在提高智能城市物联网网络管理的效率。通过利用不同传感模态时间序列数据之间的相关性,提出的DMF方法减少了用于监控的物理传感器数量,从而减少了能源消耗、通信带宽和总体部署成本。该框架将计算复杂性从边缘设备转移到核心,确保资源受限的物联网设备不会被繁重的处理任务所困扰。DMF使用马德里实际物联网部署的数据进行了验证,展示了该系统利用少数传感器精确估计交通、环境和污染指标的有效性。所提出的方法提供了一种可扩展、高效的机制来管理城市物联网网络,同时解决了传感器故障和隐私问题。
发布时间: 2/10/2025
查看原文
作者: Ciaran O'Connor, Mohamed Bahloul, Roberto Rossi, Steven Prestwich, Andrea Visentin
arXiv:2502.04935v1 Announce Type: cross 摘要:将可再生能源整合到电力市场中对电价稳定性提出了重大挑战,并增加了市场的复杂性。准确可靠的电价预测对于有效的市场参与至关重要,因为电价动态的预测更加具有挑战性。概率预测通过预测区间有效地量化了电价固有的不确定性,从而支持市场的更好决策。本文研究了使用置信预测(CP)技术提高概率价格预测的方法,特别是集成批量预测区间和序列预测置信推断。这些方法提供了精确且可靠的预测区间,在有效性指标上超过了传统的模型。我们提出了一种集成方法,将可量化回归模型的效率与时间序列适应的CP技术的稳健覆盖特性相结合。该集成方法提供了窄预测区间和高覆盖率,从而实现更可靠和准确的预测。我们进一步通过应用于电池储能系统的模拟交易算法评估了CP技术的实际影响。该集成方法在日前市场和平衡市场中均展现了改进的财务回报,突出了其对市场参与者的实际益处。
发布时间: 2/10/2025
查看原文
作者: Xiandong Zou, Mingzhu Shen, Christos-Savvas Bouganis, Yiren Zhao
arXiv:2502.04923v1 宣布类型:交叉 摘要:低秩适应(LoRA)已成为文本到图像模型中广泛采用的技术,使在多概念图像生成中精确渲染多种不同的元素(如角色和风格)成为可能。然而,当前的方法在组合这些LoRA进行多概念图像生成时面临着重大挑战,导致生成图像质量下降。在本文中,我们最初通过Fourier频率域的视角来调查LoRA在去噪过程中的作用。基于多应用LoRA可能导致“语义冲突”的假设,我们发现某些LoRA放大了高频特征,如边缘和纹理,而其他LoRA则主要关注低频元素,包括整体结构和光滑的颜色渐变。基于这些见解,我们设计了一种基于频域的序列策略,以确定LoRA在推理过程中应集成的最佳顺序。该策略提供了一种与现有LoRA融合技术中常见的直观集成相比更为系统和可推广的解决方案。为了充分利用我们所提出的LoRA顺序确定方法在多LoRA组合任务中的应用,我们引入了一种新的、无需训练的框架——缓存多LoRA(CMLoRA),旨在高效地结合多个LoRA同时保持图像的一致性生成。凭借其灵活的多LoRA融合骨干和针对各个LoRA定制的非均匀缓存策略,CMLoRA有望减少LoRA组合中的语义冲突并提高计算效率。我们的实验评估表明,与LoraHub、LoRA Composite和LoRA Switch等最先进的无需训练的LoRA融合方法相比,CMLoRA在CLIPScore上平均提高了2.19%,在MLLM胜率上提高了11.25%。
发布时间: 2/10/2025
查看原文
作者: Chenhao Si, Ming Yan, Xin Li, Zhihong Xia
arXiv:2502.04917v1 类型: cross 摘要: 我们提出了一种新颖的物理输入神经网络(PINN)架构——compleX-PINN,该架构采用了由Cauchy积分定理启发的可学习激活函数。通过学习激活函数的参数,compleX-PINN仅使用一层隐藏层就能达到高精度。实验结果表明,compleX-PINN有效地解决了传统PINN难以处理的问题,并且一致地提供显著更高的精度,通常精度高出一个数量级。
发布时间: 2/10/2025
查看原文
作者: Jie Huang, Rui Huang, Jinghao Xu, Siran Pen, Yule Duan, Liangjian Deng
arXiv:2502.04903v1 宣告类型: cross 摘要: Pansharpening 的目标是将高分辨率多光谱(PAN)图像与低分辨率多光谱(LRMS)图像相结合,生成高分辨率多光谱(HRMS)图像。尽管在频域中进行 Pansharpening 提供了明显的优势,但大多数现有方法要么仅在空间域中操作,要么未能充分利用频域的优势。为了解决这一问题,我们创新地提出了多频融合注意力(MFFA),利用小波变换清晰地分离频率,使得在不同的频域中进行无损重建成为可能。然后,我们根据不同特征所代表的物理含义生成频域查询、空间键和融合值,从而能够在频域中更有效地捕捉特定信息。此外,我们致力于在不同操作中保持频域特征的完整性。在更广阔的层面上,我们的网络采用小波金字塔,在多个尺度上逐步融合信息。与之前的频域方法相比,我们的网络在融合过程中更好地防止了不同频域特征的混淆和丢失。在多个数据集上的定量和定性实验表明,我们的方法优于现有方法,并且展示了在实际场景中的显著泛化能力。
发布时间: 2/10/2025
查看原文
作者: Levente Z\'olyomi, Tianze Wang, Sofiane Ennadir, Oleg Smirnov, Lele Cao
arXiv:2502.04899v1 宣称类型: cross 摘要:在医疗保健、电子商务、游戏和金融等多个领域中,数字化交互的激增导致生成了大量事件流(ES)数据。ES数据包含了每个领域相关的详细上下文信息,以时间戳的形式呈现连续的事件序列。尽管ES数据具有提取可操作洞察和增强决策的潜力,但其有效利用却受到数据标注稀缺性和现有研究努力碎片化的挑战。自我监督学习(SSL)作为一种新兴范式,通过从未标注的ES数据中提取有意义的表示来应对这些挑战。在本综述中,我们系统地回顾和综合了适用于跨多个领域的ES建模的SSL方法论,弥合了传统上各自为营的领域特定方法之间的差距。我们提出了一个全面的SSL技术分类,涵盖了预测和对比学习范式,并分析了它们在不同应用场景中的适用性和有效性。此外,我们指出了当前研究中的关键缺口,并提出了一个未来研究议程,旨在开发可扩展、领域通用的SSL框架,用于ES建模。通过统一分散的研究努力并强调跨领域协同效应,本综述旨在加速创新、提高可再现性,并扩大SSL在各种实际ES挑战中的应用范围。
发布时间: 2/10/2025
查看原文
作者: Ricardo Coimbra Brioso, Leonardo Crespi, Andrea Seghetto, Damiano Dei, Nicola Lambri, Pietro Mancosu, Marta Scorsetti, Daniele Loiacono
arXiv:2502.04898v1 适配性放疗类型: 交叉 摘要:适配性放疗(ART)工作流程中的一个关键步骤是在治疗时评估患者的解剖结构,以确保投射的准确性。为此,断层计算机锥形束成像(CBCT)广泛使用,因其经济实惠且易于集成到治疗过程中。然而,与CT扫描相比,CBCT图像的分辨率较低且含有更多伪影,这使其在精确治疗验证方面不够可靠。此外,在如全身和淋巴结照射(TMLI)等复杂治疗中,全身患者的可视化对于准确剂量投递至关重要,但由于CBCT图像经常不连续,导致可能存在有用解剖信息的空白区域。为解决这些局限性,我们提出了ARTInp(适配性放疗图像修补),这是一种结合图像修补和CBCT-to-CT转换的创新深度学习框架。ARTInp采用双重网络方法:一种完成网络,用于填充CBCT体素中的解剖学空白,并使用一种定制的生成对抗网络(GAN)生成高质量的合成CT(sCT)图像。我们在SynthRad 2023挑战赛中的CBCT和CT图像配对数据集上对ARTInp进行了训练,并在18名患者的测试集中取得的性能展示了其在放射治疗中增强基于CBCT的工作流程的潜力。
发布时间: 2/10/2025
查看原文
作者: Patrick Leask, Bart Bussmann, Michael Pearce, Joseph Bloom, Curt Tigges, Noura Al Moubayed, Lee Sharkey, Neel Nanda
arXiv:2502.04878v1 交叉类型 摘要:机制可解释性的共同目标是将神经网络的激活分解为特征:模型计算出的输入的可解释属性。稀疏自编码器(SAEs)是寻找这些特征在大语言模型(LLMs)中的流行方法,有人认为它们可以用来找到一组“标准”的单元:一个独特且完整的原子特征列表。我们通过两种新颖的技术对此信念提出质疑:SAE缝合以显示它们是不完整的,以及元SAE以显示它们不是原子的。SAE缝合涉及到将较大的SAE中的潜在变量插入到较小的SAE中,或交换它们。较大的SAE中的潜在变量可以分为两类:新颖潜在变量,当添加到较小的SAE时能提高性能,表明它们捕捉到了新颖信息;重建潜在变量,可以替换较小的SAE中具有类似行为的相应潜在变量。存在新颖特征表明较小的SAE是不完整的。使用元SAE(在另一个SAE的解码矩阵上训练的SAE)我们发现,SAE中的潜在变量通常分解为较小SAE中潜在变量的组合,显示较大的SAE潜在变量不是原子的。这些分解往往是可解释的;例如,代表“爱因斯坦”的潜在变量分解为“科学家”、“德国”和“著名人物”。即使SAE未能找到分析的标准单元,它们仍然可能成为有用的工具。我们建议未来的研究要么寻求不同方法来识别此类单元,要么实用地选择适合其任务的SAE大小。我们提供了一个交互式仪表板来探索元SAE:https://metasaes.streamlit.app/
发布时间: 2/10/2025
查看原文
作者: Aditya Kapoor, Kale-ab Tessera, Mayank Baranwal, Harshad Khadilkar, Stefano Albrecht, Mingfei Sun
arXiv:2502.04864v1 通告类型: cross 摘 要:在协作多智能体强化学习(MARL)中,当全局奖励稀疏且延迟时,学习有效的策略具有挑战性。这种挑战源于需在智能体和时间步骤之间分配奖励信用,而现有方法在长时间任务中往往无法有效解决这一问题。我们提出了一种新颖的方法——临时智能体奖励重分配(Temporal-Agent Reward Redistribution, $TAR^2$),该方法将稀疏的全局奖励分解为智能体特定和时间步骤特定的组件,从而为策略学习提供更频繁和准确的反馈。理论上,我们证明了(i)$TAR^2$与基于潜力的奖励塑形一致,保留与原始环境相同的最优策略;(ii)$TAR^2$保持与原始稀疏奖励下的策略梯度更新方向相同,确保无偏的信用信号。在两个具有挑战性的基准SMACLite和Google Research Football上的实验结果表明,$TAR^2$显著稳定并加速了收敛过程,在学习速度和最终性能方面均优于AREL和STAS等强基线。这些发现确立了$TAR^2$为稀疏奖励多智能体系统中智能体-时间信用分配的一个有原则且实用的解决方案。
发布时间: 2/10/2025
查看原文