arXiv 论文列表

作者: Hailong Shu, Weiwei Song, Yue Wang, Jiping Zhang

arXiv:2504.06532v1 交叉公告类型: 摘要：风向预测在优化风能生产中发挥着重要作用，但由于方向数据的循环性质、多步预测中的误差累积以及复杂的气象交互作用，面临着重大挑战。本文提出了一种新型模型WaveHiTS，该模型结合了小波变换和神经层次插值时间序列，以应对这些挑战。我们的方法将风向分解为U-V分量，应用小波变换捕捉多尺度频率模式，并利用层次结构在多个尺度上建模时间依赖性，有效缓解了误差传播。在中国内蒙古自治区的实际气象数据上进行的实验表明，WaveHiTS在所有预测步骤中，从提前60分钟起，显著优于深度学习模型（RNN、LSTM、GRU）、基于变压器的方法（TFT、Informer、iTransformer）和混合模型（EMD-LSTM）。所提出模型的RMSE值约为19.2° - 19.4°，而深度学习循环模型的RMSE值为56° - 64°，维持了一致的准确性。此外，WaveHiTS在矢量相关系数（VCC）方面表现出优越的稳健性，其值为0.985 - 0.987，命中率在88.5% - 90.1%之间，显著优于基线模型。消融研究证实，每个组成部分——小波变换、层次结构和U-V分解——对整体性能均有显著贡献。这些风向现在casting的改进对提升风力涡轮机偏航控制效率和风能并网具有重要意义。

发布时间: 4/10/2025

查看原文

超越摩尔定律：通过有效的硬件-software协同设计利用生成式人工智能的红移效应

作者: Amir Yazdanbakhsh

arXiv:2504.06531v1 声明类型：交叉摘要：几十年来，摩尔定律一直是计算机体系结构和系统设计中的坚固支柱，促进了硬件和软件之间的明确抽象。这种传统的摩尔计算范式加深了两者之间的鸿沟，使软件开发人员能够在很大程度上无需深入硬件特定优化的情况下实现近指数级的性能提升。然而，今天，随着摩尔定律——其曾不屈不挠的性能提升现在已减缓为渐进改进——面临不可避免的物理障碍，该定律的停滞需要重新评估传统的系统设计哲学。传统的分离系统设计哲学，在硬件和软件之间保持严格的抽象，日渐过时。曾经清晰的软件和硬件边界正在迅速瓦解，取而代之的是协同设计。计算社区必须加强其对硬件-软件协同设计的承诺，将系统抽象提升为头等大事，并重新构想设计原则，以满足现代计算的无尽需求。硬件-软件协同设计并不是最近的创新。为了说明其历史演变，我将其发展分为五个相对独特的“时代”。这篇文章还强调了架构社区在跨学科团队中的日益影响力，特别是在与机器学习研究人员一起工作时，并探讨了当前协同设计范式为何在当今计算格局中面临困境。此外，我还将探讨“硬件彩票”的概念，并探讨减少其对计算创新下一时代的制约影响的方向。

发布时间: 4/10/2025

查看原文

TSP-OCS：多视角手术视频分析中最优摄像头选择的时间序列预测

作者: Xinyu Liu, Xiaoguang Lin, Xiang Liu, Yong Yang, Hongqian Wang, Qilong Sun

arXiv:2504.06527v1 Announce Type: cross 摘要：记录开放手术过程对于教育和医学评估至关重要；然而，传统单一摄像头方法往往面临手术者头部和身体导致的遮挡等问题，以及固定摄像头角度的限制，这降低了视频内容的可理解性。本研究通过采用多视角摄像机记录系统来解决这些限制，从六个不同角度捕捉手术过程以减轻遮挡问题。我们提出了一种基于完全监督学习的时间序列预测方法，从多个同时记录的视频流中选择最佳的拍摄序列，确保每个时刻的最佳视角。我们的时间序列预测模型通过使用预训练模型从手术视频中提取和融合视觉和语义特征来进行未来摄像头选择的预测。这些特征通过具有TimeBlocks的时序预测网络进行处理，以捕捉序列依赖性。线性嵌入层降低维度，Softmax分类器根据最高概率选择最优摄像头视图。在我们的实验中，我们创建了5组开放甲状腺切除术视频，每一组都同时从六个不同角度进行了录制。结果表明，即使在预测更长时间范围时，我们的方法也与传统的监督方法相比取得了竞争性的精度。此外，我们的方法在我们的数据集上优于最先进的时间序列预测技术。本论文通过呈现一种创新框架，推动了手术视频分析技术的进步，这对提高手术教育和患者安全具有重要意义。

发布时间: 4/10/2025

查看原文

帕累托前沿的力量：平衡不确定奖励以在扫描探针显微镜中进行自适应实验的优势

作者: Yu Liu, Sergei V. Kalinin

arXiv:2504.06525v1 交叉类型公告摘要：自动化实验有潜力革命化科学研究，但其有效性取决于明确的优化目标，而在实际应用中这些目标往往是不确定或概率性的。在这项工作中，我们展示了多目标贝叶斯优化（MOBO）在自主实验中平衡多个竞争性奖励的应用。利用最广泛的扫描探针显微镜（SPM）成像技术之一，我们证明了MOBO可以优化成像参数，以提高测量质量、可再现性和效率。这种方法的一个关键优势是能够计算和分析帕累托前沿，这不仅指导了优化，还提供了不同目标之间权衡的物理洞察。此外，MOBO提供了一种自然框架，可以实现人类在环的决策制定，使研究人员能够根据领域专业知识微调实验权衡。通过标准化高质量、可再现的测量结果，并将人类输入整合到AI驱动的优化中，这项工作突显了MOBO作为推动自主科学研究的强大工具的价值。

发布时间: 4/10/2025

查看原文

连续变量量子编码技术：嵌入技术的比较研究及其对机器学习性能的影响

作者: Minati Rath, Hema Date

arXiv:2504.06497v1 收录类型: cross 摘要：本文探讨了连续变量量子计算（CVQC）与经典机器学习的交叉领域，重点关注CVQC数据编码技术，包括位移编码和压缩编码，以及来自离散量子计算的即时量子多项式（IQP）编码。我们进行了广泛的经验性分析，评估这些编码方法对经典机器学习模型（如 Logistic 回归、支持向量机、K-最近邻以及随机森林和 LightGBM 等集成方法）的影响。我们的研究表明，基于CVQC的编码方法显著增强了特征表达性，从而提高了分类准确性和F1分数，特别是在高维度和复杂数据集中效果尤为显著。然而，这些改进伴随着计算成本的差异，这取决于编码的复杂性和机器学习模型的架构。此外，我们还探讨了量子表达性和经典可学习性之间的权衡，提供了有关将这些量子编码整合到实际应用中的实用可行性的宝贵见解。本文为不断增长的量子-经典混合学习研究领域做出了贡献，突出了CVQC在推动量子数据表示和将其集成到经典机器学习工作流中的作用。

发布时间: 4/10/2025

查看原文

基于元学习的中毒攻击在图链接预测中的应用

作者: Mingchen Li, Di Zhuang, Keyu Chen, Dumindu Samaraweera, Morris Chang

arXiv:2504.06492v1 交叉类型：摘要：图数据中的链接预测利用了各种算法和机器学习/深度学习模型来预测图节点之间的潜在关系。这一技术在推荐系统、社区网络和生物结构等多种实际应用中得到了广泛的应用。然而，近期的研究指出了链接预测模型对于对抗攻击（如投毒攻击和规避攻击）的脆弱性。增强这些模型的抵御能力对于确保链接预测应用中的稳定和稳健表现至关重要。虽然许多工作集中在增强图卷积网络（GCN）模型的鲁棒性，但作为链接预测的一种复杂模型——变分图自编码器（VGAE），在图对抗攻击的语境下尚未得到充分研究。为了弥补这一差距，本文提出了一种使用元学习技术实施的无权图投毒攻击方法，以削弱VGAE的链接预测性能。我们在多种数据集上进行了全面的实验，评估了所提方法及其参数的效果，并将其与相似设置下的现有方法进行了比较。我们的结果表明，我们的方法显著降低了链接预测性能，并优于其他最先进的方法。

发布时间: 4/10/2025

查看原文

AI辅助传输放射性离子束

作者: Sergio Lopez-Caceres, Daniel Santiago-Gonzalez

arXiv:2504.06469v1 宣告类型:交叉摘要: 放射性重离子束使研究人员能够研究稀有和不稳定的原子核，从而深入了解奇异核的内部结构，并揭示化学元素是如何在恒星中形成的。然而，放射性束的提取和运输依赖于耗时的手动调整方法，需要手动优化数百个参数。在这里，我们介绍了一个使用人工智能(AI)辅助放射性束运输过程的系统。我们将我们的方法应用于现实生活场景，并与标准调整方法相比展示了其优势。我们的方法可以扩展到世界各地的其他放射性束设施，以提高运营效率并增强科学研究成果。

发布时间: 4/10/2025

查看原文

Agent-竞技场：评估控制算法的通用框架

作者: Halid Abdulrahim Kadi, Kasim Terzi\'c

arXiv:2504.06468v1 宣告类型: cross 摘要：机器人研究本质上具有挑战性，需要在各种环境中和控制算法方面具备专业知识。将算法适应新环境往往面临重大困难，这还伴随着数据驱动方法中需要进行大量超参数调优的需求。为了解决这些挑战，我们提出了Agent-Arena，一个Python框架，旨在简化决策策咯政策在广泛基准环境中的集成、复制、开发和测试。与现有框架不同，Agent-Arena具有通用性，可以支持所有类型的控制算法，并且可以适应模拟和真实机器人场景。请参见我们的GitHub代码库 https://github.com/halid1020/agent-arena-v0。

发布时间: 4/10/2025

查看原文

federated神经架构搜索与模型无感元学习

作者: Xinyuan Huang, Jiechao Gao

arXiv:2504.06457v1 交叉公告类型摘要：联邦学习（FL）常常因为用户数据在设备间的自然不均匀分布而难以应对数据异质性问题。联邦神经架构搜索（NAS）能够促进针对异质数据的最优模型架构的协作搜索，以实现更高的准确率。然而，这一过程由于搜索空间广泛和重复训练而耗时。为克服这一问题，我们提出了FedMetaNAS框架，在FL背景下结合元学习与NAS，通过减少搜索空间和去除重复训练来加速架构搜索。我们的方法首先利用Gumbel-Softmax重参数化来促进搜索空间中混合操作的松弛。然后，我们通过引入模型无关的元学习技术，结合特定任务的学习器不仅调整权重，还调整架构参数（α），而元学习器则根据任务学习器的梯度信息调整整个模型的权重和α。在元更新之后，我们提出使用相同的技巧在搜索空间中进行软剪枝，逐步稀疏化架构，确保剪枝后的选定架构性能仍然稳健，从而可以在不进行重复训练的情况下立即使用模型。实验评估显示，与FedNAS相比，FedMetaNAS能够将搜索过程加速超过50％，并在更高准确率上实现这一点。

发布时间: 4/10/2025

查看原文

你能微调你的双筒望远镜？将文本水印嵌入大型语言模型的权重中

作者: Fay Elhassan, Niccol\`o Ajroldi, Antonio Orvieto, Jonas Geiping

arXiv:2504.06446v1 标签类型：交叉摘要：人工智能生成内容与人类文本难以区分，这为透明度和问责制带来了挑战。虽然存在几种在API后面的模型中嵌入水印的方法，但在模型权重中直接嵌入水印策略，这些权重在后续生成的输出中反映出来，这具有挑战性。在这项研究中，我们提出了一种策略，通过微调模型的一对低秩适配器，一个作为文本生成模型，另一个作为检测器，使在第一个模型生成的文本中嵌入细水印，并同时优化第二个模型的检测性。通过这种方式，水印策略是端到端学习的。这一过程提出了优化挑战，因为平衡水印的鲁棒性、自然性和任务性能需要权衡。我们讨论了优化这一极小极大目标的策略，并展示了对指令微调的这一修改的影响结果。

发布时间: 4/10/2025

查看原文