arXiv 论文列表

作者: Qingdi Yu, Zhiwei Cao, Ruihang Wang, Zhen Yang, Lijun Deng, Min Hu, Yong Luo, Xin Zhou

arXiv:2503.21251v1 宣告类型: cross 摘要:时间序列预测对于资源调度和风险管理等应用至关重要，其中多步预测能够提供对未来趋势的全面理解。不确定性量化(UQ)是应对预测不确定性的主流方法，其中基于同值预测(CP)因其模型无关性和统计保证而备受关注。然而，大多数CP的变体是为单步预测设计的，在多步场景中面临着一些挑战，例如对实时数据的依赖以及可扩展性有限。这突显了专门为多步预测设计的CP方法的必要性。我们提出了双分割同值预测(DSCP)方法，这是一种新型的CP方法，旨在捕捉时间序列数据中的内在依赖性，以进行多步预测。对四个不同领域的实际数据集进行的实验结果表明，提出的DSCP方法在Winkler得分方面明显优于现有的CP变体，与最先进的方法相比，性能提高了高达23.59%。此外，我们在一个实际的轨迹基础应用中部署了DSCP方法，用于可再生能源发电和IT负载预测，在电力管理中通过预测优化数据中心的操作和控制，实现了11.25%的碳排放减少。

发布时间: 3/28/2025

查看原文

ResearchBench：通过灵感驱动的任务分解在科学发现中评估语言模型

作者: Yujie Liu, Zonglin Yang, Tong Xie, Jinjie Ni, Ben Gao, Yuqiang Li, Shixiang Tang, Wanli Ouyang, Erik Cambria, Dongzhan Zhou

arXiv:2503.21248v1 类型: cross 摘要：大型语言模型（LLMs）在辅助科学研究方面显示出潜力，但由于缺乏专用基准，它们发现高质量研究假设的能力仍待检验。为解决这一问题，我们引入了首个大规模基准，用于评估LLMs，并涵盖了科学研究的近充分子任务：灵感检索、假设组成和假设排序。我们开发了一个自动框架，从涵盖12个学科的科学论文中提取关键组件——研究问题、背景调查、灵感和假设，并通过专家验证确保其准确性。为了防止数据污染，我们仅关注2024年发表的论文，确保其与LLM预训练数据的重叠最少。我们的评估表明，LLMs在检索灵感方面表现出色，这是一个分布外任务，这表明它们能够揭示新的知识关联。这使LLMs成为“研究假设矿”，能够通过大量生成创新性假设来促进自动化科学发现，同时 minimal human intervention（最小的人工干预）最少。

发布时间: 3/28/2025

查看原文

改进基于逐层聚合和余弦距离的$(\alpha, f)$-拜占庭容错性在联邦学习中的性能

作者: Mario Garc\'ia-M\'arquez, Nuria Rodr\'iguez-Barroso, M. Victoria Luz\'on, Francisco Herrera

arXiv:2503.21244v1 交叉公告类型摘要：人工智能系统的发展加剧了社会对其使用的担忧，这要求制定涵盖数据隐私的监管框架。联邦学习（FL）通过实现不共享数据的协作模型训练，被提出为解决分布式机器学习中数据隐私挑战的潜在解决方案。然而，FL系统在拜占庭攻击面前仍然脆弱，恶意节点会提供篡改的模型更新。尽管拜占庭鲁棒操作已成为广泛采用的稳健聚合算法，以减轻这些攻击，但在高维度参数空间中的效果显著减弱，有时会导致性能不佳的模型。本文介绍了一种新的聚合方案——逐层余弦聚合，旨在在高维设置中增强这些规则的鲁棒性，同时保持计算效率。提供了一种理论分析，展示了所提出的逐层余弦聚合相较于原始鲁棒聚合操作符的优越鲁棒性。在不同数据分布和拜占庭攻击场景下，使用多种图像分类数据集的实验评估一致地展示了逐层余弦聚合的改进性能，实现了高达16%的模型准确度提升。

发布时间: 3/28/2025

查看原文

增强特征的机器学习方法在医疗数据中的全因 mortality 预测

作者: HyeYoung Lee, Pavel Tsoi

arXiv:2503.21241v1 类型: cross 摘要：准确的患者死亡率预测能够实现有效的风险分层，从而制定个性化治疗方案并改善患者预后。然而，在医疗保健中预测死亡率仍然是一项重大挑战，现有研究往往集中于特定的疾病或有限的预测变量集。本研究通过使用MIMIC-III数据库评估机器学习模型在全因院内死亡率预测方面的性能，并采用全面的特征工程方法。在临床专业知识和文献的指导下，我们提取了关键特征，如生命体征（例如，心率、血压）、实验室结果（例如，肌酐、血糖）和人口统计信息。随机森林模型表现最优，AUC为0.94，显著优于其他机器学习和深度学习方法。这表明随机森林在处理高维、嘈杂的临床数据方面具有稳健性，并且有潜力开发有效的临床决策支持工具。我们的研究结果强调了精细特征工程对于准确死亡率预测的重要性。最后，我们讨论了临床应用的含义，并提出了未来方向，包括增强模型的稳健性以及为特定疾病定制预测模型。

发布时间: 3/28/2025

查看原文

带有偏差意识的智能体：在AI驱动的知识检索中提升公平性

作者: Karanbir Singh, William Ngu

arXiv:2503.21237v1 类型:交叉摘要：在互联网创建的几十年以来，检索可获取信息的进步在过去几年中更快。搜索引擎，如谷歌，一直是查找相关数据的主要方式。它们一直依赖于用户的能力，在亿万链接和数据源唾手可得的情况下找到最好的信息。大型语言模型（LLMs）的出现彻底改变了信息检索领域。LLMs不仅在检索相关知识方面表现出色，还在有效地总结知识方面表现出色，使得信息更具可访问性和可消费性。除此之外，AI代理的兴起还为信息检索引入了另一个方面，即动态信息检索，它可以整合实时数据，如天气预报和金融数据，与知识库结合以构建上下文相关的知识。然而，尽管取得了这些进步，代理仍容易受到偏见和公平性问题的影响，这些问题深深扎根于知识库和LLMs的训练之中。本研究通过利用代理框架和创新使用偏见检测器作为工具来识别并凸显检索内容中的固有偏见，提出了一个新颖的偏见意识知识检索方法。通过赋予用户透明度和意识，这种方法旨在促进更加公平的信息系统，并推动负责任的AI的发展。

发布时间: 3/28/2025

查看原文

GenFusion：在视频中重建与生成之间建立闭环

作者: Sibo Wu, Congrong Xu, Binbin Huang, Andreas Geiger, Anpei Chen

arXiv:2503.21219v1 Announce Type: cross 摘要：最近，3D重建和生成展示了令人印象深刻的新型视图合成结果，实现了高保真度和高效性。然而，这两个领域之间存在明显的条件差距，例如，可扩展的3D场景重建通常需要密集捕获的视图，而3D生成通常依赖于一个或没有输入视图，这极大地限制了它们的应用。我们发现，这种现象的原因在于3D约束与生成先验之间的不匹配。为了解决这个问题，我们提出了一种基于重建的视频扩散模型，该模型学习在易产生伪影的RGB-D渲染上条件化视频帧。此外，我们提出了一种循环融合管道，该管道通过迭代将生成模型的修复帧添加到训练集中，从而逐步扩展，并解决先前重建和生成管道中存在的视角饱和限制。我们的评估，包括从稀疏视图和遮罩输入生成视图的合成，验证了我们方法的有效性。

发布时间: 3/28/2025

查看原文

adversarial 磨损与损坏：利用自然损坏生成物理世界 adversarial 示例

作者: Samra Irshad, Seungkyu Lee, Nassir Navab, Hong Joo Lee, Seong Tae Kim

arXiv:2503.21164v1 类型:交叉摘要：物理世界中存在的对抗样本对在自主驾驶等关键安全应用中部署深度神经网络提出了重大挑战。目前大多数用于生成物理世界对抗样本的方法都是临时的，依赖于特定场景的手动修改，例如阴影、激光束或贴纸。在本文中，我们介绍了一类新的物理世界对抗样本AdvWT，它借鉴了自然现象“磨损和损坏”这一物理对象的固有特性。与人工制造的扰动不同，“磨损和损坏”是由于环境退化随着时间有机产生的，如户外标志牌的逐渐损坏。为了实现这一点，AdvWT采取两步方法。首先，使用基于生成对抗网络（GAN）的无监督图像到图像的转换网络来模拟这些自然出现的损伤，特别是在户外标志牌的上下文中。转换网络将受损标志的特征编码为一个潜在的“损伤样式代码”。在第二步中，我们向样式代码中引入对抗扰动，有策略地优化其转换过程。这种操作微妙地改变了损伤样式的表示，指导网络生成对抗图像，使损伤的外观在感知上仍然看起来是真实的，同时确保其对神经网络具有误导性。通过在两个交通标志数据集上进行全面实验，我们展示了AdvWT在数字和物理领域都有效地误导了DNNs。AdvWT在对抗成功率、鲁棒性和天然外观方面均优于现有的物理世界对抗样本。此外，在训练中集成AdvWT可以增强模型对真实世界损坏标志的泛化能力。

发布时间: 3/28/2025

查看原文

不同隐私- utility 平衡的多目标优化在差分隐私联邦学习中的应用

作者: Kanishka Ranaweera, David Smith, Pubudu N. Pathirana, Ming Ding, Thierry Rakotoarivelo, Aruna Seneviratne

arXiv:2503.21159v1 Announce Type: 跨越摘要：联邦学习（FL）能够在不共享原始数据的情况下让分布式客户端协作进行模型训练，使其成为隐私保护机器学习的一种有前途的方法。然而，在FL中保证差分隐私（DP）面临着挑战，因为模型效用和隐私保护之间存在权衡。在聚合前对梯度进行裁剪是一种常见的限制隐私损失的策略，但选择最优的裁剪范数并不简单，因为过高值会损害隐私，而过于严格的裁剪会降低模型性能。在本项工作中，我们提出了一种自适应裁剪机制，使用多目标优化框架动态调整裁剪范数。通过将隐私和效用考虑融入优化目标中，我们的方法平衡了隐私保护与模型精度。我们从理论上分析了我们方法的收敛性质，并通过在MNIST、Fashion-MNIST和CIFAR-10数据集上的广泛实验证明了其有效性。结果显示，自适应裁剪在相同的隐私约束下始终优于固定裁剪基准，实现了更高的准确性。本文强调了动态裁剪策略在不同类型的差分隐私联邦学习中增强隐私-效用权衡的潜力。

发布时间: 3/28/2025

查看原文

联邦学习中的差分隐私：一种实用性增强的方法

作者: Kanishka Ranaweera, Dinh C. Nguyen, Pubudu N. Pathirana, David Smith, Ming Ding, Thierry Rakotoarivelo, Aruna Seneviratne

arXiv:2503.21154v1 共享类型: 交叉摘要：联邦学习已经发展成为一种保护数据隐私的吸引人的方式，通过消除共享客户端数据的需要，同时与集中式机器学习算法相比降低成本。然而，近期的研究表明，联邦学习本身并不能保证隐私，因为私有数据仍然可能从上传到中央服务器的参数中推断出来。为了成功避免数据泄露，通过采用差分隐私（DP）在局部优化过程中或在局部更新聚合过程中实现样本级或用户级隐私保护，已经成为两种可行的方法。然而，与它们的非隐私等效方法相比，这些方法在实用性方面表现较差。为了改善隐私-实用性权衡，我们基于哈耳小波变换步骤和一种新型噪声注入方案，对这些标准的差分隐私算法进行了修改，显著降低了噪声方差的渐近界。我们还对所提出的算法进行了整体收敛性分析，证明了我们的方法在收敛性能上优于标准的DP算法。在真实数据集上的数值实验表明，我们的方法在保持相同隐私保证的同时，优于现有方法的模型实用性。

发布时间: 3/28/2025

查看原文

低级特征隐藏着跨域少样本分割的奥秘

作者: Yuhan Liu, Yixiong Zou, Yuhua Li, Ruixuan Li

arXiv:2503.21150v1 Announce Type: 交叉摘要：跨域少样本分割（CDFSS）提出了一种方法，将从大规模源域数据集学习到的像素级分割能力转移到下游目标域数据集上，只需每个类别的几幅标注图像。在本文中，我们关注CDFSS中一个已观察到但未解决的现象：对于目标域，特别是那些与源域相距甚远的目标域，分割性能在很早的训练周期达到峰值，并随着源域训练的进行急剧下降。我们深入探讨了这一现象的解释：低级特征容易受到领域转移的影响，导致在源域训练过程中出现更尖锐的损失景观，这是CDFSS的敌人。基于此现象及其解释，我们进一步提出了一种方法，包括两个即插即用模块：一个模块在源域训练期间对低级特征的损失景观进行拉平，作为一种新颖的锋利度感知最小化方法；另一个模块在目标域测试期间利用基于低级特征的校准直接补充目标域信息。在四个目标数据集上的广泛实验验证了我们的理论，并表明我们的方法在1-shot和5-shot场景中分别在平均MIoU上显著超过了当前最先进的方法3.71%和5.34%。

发布时间: 3/28/2025

查看原文