arXiv 论文列表

作者: Ruizhan Xue, Huimin Deng, Fang He, Maojun Wang, Zeyu Zhang

arXiv:2502.08353v1 宣告类型: cross 摘要: 随着图神经网络（GNNs）在各个领域的广泛应用，它们的信任问题已成为研究的焦点。一些现有研究表明，结合大规模语言模型（LLMs）可以提高GNNs的语义理解和生成能力，从而从多个方面提高GNNs的信任度。我们的回顾介绍了一种分类法，为研究人员提供了一个清晰的框架来理解不同方法的原则和应用，并帮助阐明各种方法之间的联系和差异。然后我们沿着我们分类法的四个类别系统地回顾了代表性方法。通过我们的分类法，研究人员可以理解每种方法在GNN与LLM可信融合中的适用场景、潜在优势和局限性。最后，我们提出了LLM和GNN集成以提高模型信任度的一些有前景的研究方向和未来趋势。

发布时间: 2/13/2025

查看原文

图基础模型在推荐中的应用：一个全面的综述

作者: Bin Wu, Yihang Wang, Yuanhao Zeng, Jiawei Liu, Jiashu Zhao, Cheng Yang, Yawen Li, Long Xia, Dawei Yin, Chuan Shi

arXiv:2502.08346v1 交叉公告类型摘要：推荐系统（RS）作为导航在线信息广阔范围的基本工具，深度学习的进步在提高排名准确性方面发挥着越来越重要的作用。其中，图神经网络（GNNs）在提取高层结构信息方面表现出色，而大型语言模型（LLMs）则被设计用于处理和理解自然语言，使这两种方法都极为有效且广泛采用。近期的研究重点在于图基础模型（GFMs），这些模型将GNNs和LLMs的优势结合起来，通过利用基于图的用户-项目关系结构以及文本理解，更有效地建模复杂的RS问题。在这篇综述中，我们通过介绍当前方法的清晰分类、深入探讨方法论细节、并强调关键挑战和未来方向，提供了一种基于GFMs的RS技术的全面概述。通过综合近期的发展，我们旨在为基于GFMs的推荐系统不断演变的格局提供有价值的见解。

发布时间: 2/13/2025

查看原文

基于层次学习的图划分在大规模车辆路线问题中的应用

作者: Yuxin Pan, Ruohong Liu, Yize Chen, Zhiguang Cao, Fangzhen Lin

arXiv:2502.08340v1 宣告类型：交叉摘要：基于分而治之方法的神经求解器用于车辆路线问题（VRP），特别是带容量约束的车辆路线问题（CVRP），将实例的全局划分与每个子问题的局部构建结合起来，以提高泛化能力。然而，在全局划分阶段，子图中的误聚类有趋势在整个基于学习的划分策略的多步解码过程中逐渐累积。这种全局划分阶段的次优行为可能会导致基于分解的整体系统性能急剧下降，即使使用了最优的局部构建。为了解决这些问题，我们提出了一种通用的层次学习基于图划分（HLGP）框架，该框架通过整合全局和局部划分策略以协同方式优化CVRP实例的划分。具体而言，全局划分策略负责创建粗粒度的多路划分，生成更简单的两路划分子任务序列。这些子任务标志着后续K级局部划分级别的开始。在每个局部划分级别中，该级别独有的子任务被分配给局部划分策略，该策略利用对局部拓扑特征不敏感的优势，逐步缓解累积的错误。该框架的通用性在于，它优化涉及的划分策略以实现与强化学习（RL）和监督学习（SL）相和谐兼容的统一目标。(**由于arXiv的通知“摘要字段不能超过1,920个字符”，给出的摘要进行了缩写。完整的摘要请下载文章。**)

发布时间: 2/13/2025

查看原文

面向碳效率的液体冷却数据中心集群层次化多代理框架

作者: Soumyendu Sarkar, Avisek Naug, Antonio Guillen, Vineet Gundecha, Ricardo Luna Gutierrez, Sahand Ghorbanpour, Sajad Mousavi, Ashwin Ramesh Babu, Desik Rengarajan, Cullen Bash

arXiv:2502.08337v1 公告类型: cross 摘要: 减少云计算对环境的影响需要有效地在地理上分散的数据中心集群（DCCs）之间分配工作负载，并同时优化数据中心内部工作负载时间转移下的液体和空气（HVAC）冷却。本文介绍了Green-DCC，它提出了一种基于强化学习（RL）的分层控制器，以动态优化DCC中的工作负载和液体冷却。通过纳入天气、碳强度和资源可用性等因素，Green-DCC解决了现实中的约束条件和相互依赖性。我们展示了该系统如何同步优化多个数据中心，使其能够扩展到数字孪生的范围，并基于碳排放和可持续性指标比较了各种RL方法的表现，同时提供了可持续性研究中更广泛的ML研究的框架和基准仿真。

发布时间: 2/13/2025

查看原文

修改检测与生成文本检测：通过水印实现对LLM输出的双重检测能力

作者: Yuhang Cai, Yaofei Wang, Donghui Hu, Gu Chen

arXiv:2502.08332v1 宣告类型: cross 摘要: 大型语言模型（LLMs）的发展引发了潜在滥用的担忧。一种实际的解决方案是在文本中嵌入水印，通过水印提取来进行所有权验证。现有的方法主要侧重于抵御修改攻击，往往忽视了其他欺骗攻击。例如，攻击者可以通过修改带有水印的文本来产生有害内容，同时不破坏水印的存在，这可能导致错误地将这种恶意内容归咎于LLM。这种情况对LLM服务提供商构成了严重威胁，突显了同时实现修改检测和生成文本检测的重要性。因此，我们提出了一种技术来检测对无偏水印的修改。我们引入了一个新的度量标准叫做“丢弃的标记”，它衡量未被水印检测包含的标记数量。当发生修改时，该度量标准会发生变化，并可作为修改的证据。此外，我们改进了水印检测过程，并引入了一种新的无偏水印方法。我们的实验表明，我们可以通过水印实现有效的双重检测能力：修改检测和生成文本检测。

发布时间: 2/13/2025

查看原文

通过约束意识型提示减轻多模态空间关系中的幻觉

作者: Jiarui Wu, Zhuo Liu, Hangfeng He

arXiv:2502.08317v1 类型: cross 摘要：空间关系幻觉在大型视觉-语言模型（LVLMs）中一直是一个持续的挑战，导致模型在生成图像中对象位置和空间配置的不正确预测。为了解决这个问题，我们提出了一种约束感知提示框架，旨在减少空间关系幻觉。具体来说，我们引入了两种类型的约束：（1）双向约束，确保对象对间关系的一致性；（2）传递性约束，确保多个对象之间的关系依赖性。通过引入这些约束，LVLMs可以生成更具空间连贯性和一致性的输出。我们利用三种广泛使用的空间关系数据集评估了我们的方法，并展示了相对于现有方法的性能提升。此外，对各种双向关系分析选择和传递性参考的选择进行系统的分析也突显了我们的方法在通过引入约束减轻空间关系幻觉方面的更大潜力。

发布时间: 2/13/2025

查看原文

HDT：分层离散变压器多变量时间序列预测

作者: Shibo Feng, Peilin Zhao, Liu Liu, Pengcheng Wu, Zhiqi Shen

arXiv:2502.08302v1 交叉公告类型：跨学科摘要：生成模型在多变量时间序列预测（MTS）中引起了显著的关注，特别是由于它们能够生成高保真样本的能力。预测多变量时间序列的概率分布是一项既具有挑战性又实际的任务。尽管最近有一些尝试处理这一任务，但仍然存在两大挑战：1) 一些现有的生成方法在高维多变量时间序列预测中的表现不佳，难以扩展到更高维度；2) 内在的高维多变量属性限制了现有生成模型的预测长度。在本文中，我们指出离散的标记表示可以使用更快的推理时间来建模高维MTS，并且通过自身长期趋势预测目标可以提高预测长度的准确性。受此启发，我们提出了一种名为层次离散变换器（HDT）的向量化量化框架，该框架通过增强的L2归一化向量化量化策略将时间序列建模为离散标记表示，从而将MTS预测转换为离散标记生成。为了解决生成模型在长期预测中的限制，我们提出了一种层次离散变换器模型。该模型在低层捕捉目标的离散长期趋势，并利用这一趋势作为条件来生成高层的目标离散表示，从而引入目标自身的特征以在高维MTS中扩展预测长度。在五个流行的时间序列数据集上的广泛实验验证了我们提出方法的有效性。

发布时间: 2/13/2025

查看原文

通过欺骗攻击牺牲语言模型的诚实性和无辜性

作者: Laur\`ene Vaugrante, Francesca Carlon, Maluna Menke, Thilo Hagendorff

arXiv:2502.08301v1 交叉类型: cross 摘要: 近期对大型语言模型（LLMs）的研究已经展示了它们理解并运用欺骗行为的能力，即使没有明确的提示也是如此。然而，这种行为只在极少数、专门的情况下被观察到，并未显示会对用户构成严重风险。此外，在AI对齐方面的研究已经取得了显著进展，通过训练模型拒绝生成误导性或有毒内容。因此，LLMs 一般变得诚实且无害。在这项研究中，我们介绍了一种新的攻击方法，这种方法损害了这两种特性，揭示了一种可被利用的漏洞，如果被利用，可能会导致严重的现实世界后果。特别地，我们引入了增强欺骗倾向的微调方法，这些“欺骗攻击”将模型定制为在针对选定主题进行提示时愚弄用户，而在其他方面保持准确。此外，我们发现，欺骗模型还会表现出毒性，生成带有仇恨言论、刻板印象和其他有害内容。最后，我们评估了模型在多轮对话中能否一致地欺骗，结果不一。鉴于数百万用户与基于LLM的聊天机器人、语音助手、代理和其他无法确保可信度的界面交互，抵御欺骗攻击以确保这些模型的安全至关重要。

发布时间: 2/13/2025

查看原文

CRISP：条件随机场介导的冷冻电子显微镜图像分割与处理框架

作者: Szu-Chi Chung, Po-Cheng Chou

arXiv:2502.08287v1 交叉公告类型摘要：在低温电子显微镜（cryo-EM）中，从微图中区分信号是一个关键的初始步骤，但由于信噪比（SNR）低、存在污染物以及大小不一的密集颗粒，这一过程仍较为耗时。虽然最近已经引入了图像分割技术以在像素级别区分颗粒，但由于SNR低，自动生成用于监督模型训练的准确注释变得复杂。此外，系统比较不同流水线构建设计选择的平台尚缺乏。因此，模块化框架对于理解这种方法的优势和局限性并推动进一步发展至关重要。为应对这些挑战，我们提出了一种流水线，可以从cryo-EM数据中自动生成高质量的分割图，作为ground truth标签。我们的模块化框架允许选择多种分割模型和损失函数。我们还通过不同求解器和特征集将条件随机字段（CRFs）与粗预测进行整合，以生成更精细的分割。这种灵活性使我们能够针对cryo-EM数据集进行定制优化配置。在有限的微图集上进行训练时，我们的方法在合成数据上实现了超过90%的准确率、召回率、精密度、交并比（IoU）和F1分数。此外，为了展示我们框架在下游分析中的有效性，我们展示了通过我们的流水线提取的颗粒能够生成比现有颗粒拾取器在真实实验数据集上生成的更高分辨率的3D密度图，同时性能可以与专业知识手动标记的数据集相媲美。

发布时间: 2/13/2025

查看原文

个体化治疗效果估计与复合治疗和复合结局

作者: Vinod Kumar Chauhan, Lei Clifton, Gaurav Nigam, David A. Clifton

arXiv:2502.08282v1 类型: cross 摘要: 个体化治疗效应（ITE）的估计——即通过观察数据，估计一组变量（也称为暴露、治疗、行为、政策或干预）即所谓的“复合治疗”，对一组感兴趣的结局变量，即所谓的“复合结局”——对于一个单位的影响——仍然是因果推断中的一个基本问题，该问题在各个学科中都有应用，如医疗、经济、教育、社会科学、营销和计算机科学。因果机器学习在ITE估计方面的先前工作仅限于简单的情况，例如单一治疗和单一结局。这阻碍了它们在复杂现实场景中的应用；例如，考虑研究不同ICU干预措施对心脏手术后住院患者的房颤和院内死亡率等不同感兴趣的结局的影响。对复合治疗和复合结局的研究有限，主要是由于所有治疗和结局的数据稀缺。为了解决上述挑战，我们提出了一种新颖且创新的基于超网络的方法，称为“H-Learner”，以解决在复合治疗和复合结局下ITE估计的问题。该方法通过动态在治疗和结局之间共享信息，解决了数据稀缺的问题。我们的实证分析表明，与现有方法相比，所提出的方法在二元和任意复合治疗和结局方面具有有效性。

发布时间: 2/13/2025

查看原文