arXiv 论文列表

作者: Xiao Zhou, Yuze Sun, Jie Wu, Xiaomeng Huang

arXiv:2504.15322v1 宣传类型: cross 摘要：本研究介绍了ReSA-ConvLSTM，这是一种用于数值天气预测(NWP)系统性偏差校正的人工智能框架。我们通过结合动态气候归一化、具有时间因果约束的ConvLSTM以及残留自注意力机制提出了三项创新。该模型在ECMWF预报与ERA5再分析数据之间建立了具有物理意识的非线性映射。使用1981年至2021年的全球大气数据，该框架减少了2米气温(T2m)、10米风速(U10/V10)和海平面气压(SLP)的系统性偏差，在1至7天预报中与操作中的ECMWF输出相比，实现了高达20%的均方根误差(RMSE)减少。轻量级的架构（10.6M参数）使得该框架能够高效地泛化到多个变量和下游应用，通过偏差校正边界条件，在跨变量校正中将重新训练时间减少了85%，同时提升了海洋模型的技能。消融实验表明，我们的创新显著提高了模型的校正性能，这表明将变量特性纳入模型有助于提升预测技能。

发布时间: 4/23/2025

查看原文

使用Swin Transformer和移位窗注意力增强DR分类

作者: Meher Boulaabi, Takwa Ben A\"icha Gader, Afef Kacem Echi, Zied Bouraoui

arXiv:2504.15317v1 Announce Type: cross 摘要：糖尿病视网膜病变（DR）是全球范围内导致失明的主要原因之一，强调了早期检测对于有效治疗的重要性。然而，由于图像质量的差异、类别不平衡以及像素级别的相似性导致的模型训练困难，自动化DR分类仍然具有挑战性。为应对这些问题，我们提出了一种稳健的预处理流水线，结合了图像裁剪、限制定量自适应直方图均衡化（CLAHE）以及目标化数据增强，以提高模型的泛化能力和鲁棒性。我们的方法利用了Swin Transformer，该模型采用分层标记处理和移位窗口注意力机制，可以在保持线性计算复杂度的同时高效地捕捉细微特征。我们在Aptos和IDRiD数据集上对多类DR分类进行了验证，分别达到了89.65%和97.40%的准确率。这些结果表明了我们模型的有效性，尤其是在早期阶段的DR检测方面，突显了其在临床环境中改善自动化视网膜筛查的潜力。

发布时间: 4/23/2025

查看原文

由扩散驱动的惯性生成数据的智能手机位置分类

作者: Noa Cohen, Rotem Dror, Itzik Klein

arXiv:2504.15315v1 通知类型: cross 摘要：尽管惯性测量在运动跟踪和导航系统中发挥着关键作用，但收集大量惯性数据的时间消耗和资源密集性阻碍了该领域稳健的机器学习模型的发展。近年来，扩散模型作为一种革命性的生成模型类出现，重塑了人工数据生成的格局。这些模型在复杂任务上超越了生成对抗网络和其它最先进的方法。在这项工作中，我们提出了一种基于扩散模型的特定力生成数据用于智能手机位置识别。我们通过多指标比较合成和实际记录的特定力数据，提供了一种全面的评估方法。结果显示，我们基于扩散模型的生成模型成功捕捉了不同智能手机放置条件下特定力信号的独特特征。因此，通过创造多样且真实的合成数据，我们可以减轻大量数据收集的负担，同时为机器学习模型提供高质量的训练数据。

发布时间: 4/23/2025

查看原文

RINN: 基于物理引导神经网络的一-shot 雷达频率成像

作者: Fei Shang, Haohua Du, Dawei Yan, Panlong Yang, Xiang-Yang Li

arXiv:2504.15311v1 宣传类型: cross 摘要: 由于射频(RF)成像技术能够在非视距和低光环境中工作，因此人们期望它能为具身智能和多模态传感带来新的可能性。然而，广泛使用的RF设备（如Wi-Fi）往往难以提供高精度的电磁测量和大规模数据集，阻碍了RF成像技术的应用。在本文中，我们结合了PINN的理念设计了RINN网络，使用物理约束而非真实值比较约束，并根据普遍存在的RF信号的特点对其进行调整，从而使RINN网络能够在单个样本、无相位噪声和幅度噪声的情况下实现RF成像。我们的数值评估结果表明，与基于相位数据的5种经典成像算法相比，RINN基于无相位数据的成像结果质量和指标（如RRMSE 0.11）相当好。RINN为射频成像技术的普遍发展提供了新的可能性。

发布时间: 4/23/2025

查看原文

电力变压器健康指数和寿命评估：基于传统方法和机器学习的方法全面综述

作者: Syeda Tahreem Zahra, Syed Kashif Imdad, Sohail Khan, Sohail Khalid, Nauman Anwar Baig

arXiv:2504.15310v1 交叉公告类型摘要：电力变压器在电力系统中起着至关重要的作用，因此对其健康状况和剩余寿命的评估及预测对于确保高效运行和促进有效的维护计划至关重要。本文对现有文献进行了全面的研究，重点放在这一领域中传统技术和最新技术的应用上。本文对最新方法和技术的优缺点进行了详尽的分析和解释。此外，本文还探讨了智能故障诊断方法，并深入研究了最广泛使用的智能算法以评估变压器的状态。包括人工神经网络（ANN）、卷积神经网络（CNN）、支持向量机（SVM）、随机森林（RF）、遗传算法（GA）和粒子群优化（PSO）等多样化的智能方法被详细阐述，提供了改进变压器故障诊断性能的实用解决方案。方法的组合与时间序列分析的探索进一步提高了诊断精度，并有助于早期发现变压器故障。通过全面展示变压器故障诊断领域的智能应用，本文为进一步研究奠定了基础，并促进了这一关键研究领域的进步。

发布时间: 4/23/2025

查看原文

异构集群上的高 throughput LLM 推理

作者: Yi Xiong, Jinqi Huang, Wenjie Huang, Xuebing Yu, Entong Li, Zhixiong Ning, Jinhua Zhou, Li Zeng, Xin Chen

arXiv:2504.15303v1 公告类型: cross 摘要: 目前，许多公司拥有各种类型的AI加速器，形成了异构集群。有效地利用这些集群进行高吞吐量的大规模语言模型（LLM）推理服务可以显著降低成本并加快任务处理。然而，异构集群上的LLM推理带来了两个主要挑战。首先，不同的部署配置可能导致性能差异巨大。可能的配置数量很多，评估特定设置的有效性复杂。因此，找到最优配置并不是一件容易的事。其次，异构集群中的LLM推理实例具有不同的处理能力，导致处理推理请求的速度不同。评估这些能力并设计一个能够充分利用每个实例潜在能力的请求调度算法是具有挑战性的。在本文中，我们提出了一个在异构集群上的高吞吐量推理服务系统。首先，通过建模资源量和期望吞吐量并使用穷举搜索方法优化部署配置。其次，提出了一种新的机制来调度实例之间的请求，该机制充分考虑了各种实例的不同处理能力。广泛的实验表明，提出的调度器在两个异构集群上分别将吞吐量提高了122.5%和33.6%。

发布时间: 4/23/2025

查看原文

一种受生物学启发的鲁棒信任模型，用于应对快速性能波动的开放多代理系统

作者: Zoi Lygizou, Dimitris Kalles

arXiv:2504.15301v1 通报类型: 切换摘要：信任管理提供了一种替代方案，用于保护开放、动态和分布式多智能体系统，而传统的加密方法在实践中证明并不实用。然而，现有的信任模型在智能体流动性、行为变化以及冷启动问题方面存在挑战。为了应对这些问题，我们引入了一种生物启发的信任模型，在这种模型中，托管实体评估自己的能力并存储信任数据。这种设计提高了移动性支持，减少了通信开销，抵御了虚假信息，并保护了隐私。尽管具有这些优势，先前的评估发现，我们的模型在适应提供者人群变化和持续性能波动方面存在局限性。本研究提出了一种新型算法，该算法结合了一种自分类机制，用于检测可能对服务消费者不利的性能下降。模拟结果显示，新算法在处理动态托管实体行为方面优于其原始版本以及FIRE，一种知名的信任和声誉模型。尽管FIRE在极端环境变化下仍具有竞争力，提出的算法在各种情况下的适应性更强。与现有的信任建模研究不同，本研究利用广泛认可的信任模型标准，对我们的模型进行了全面评估，评估了其对常见信任相关攻击的抗御能力，同时识别了其优势、弱点以及潜在的应对措施。最后，提出了若干对未来研究的关键方向。

发布时间: 4/23/2025

查看原文

D\$^{2}\$MoE：双路由和动态调度以提高设备上基于MoE的LLM服务效率

作者: Haodong Wang, Qihua Zhou, Zicong Hong, Song Guo

arXiv:2504.15299v1 类型: cross 摘要: 专家混合模型（MoE）是一种稀疏的大语言模型（LLMs）变体，旨在在智能能力和计算开销之间取得更好的平衡。尽管MoE有一些优点，但仍然在资源受限的边缘设备上部署过于昂贵，尤其是在需求边缘设备推理服务的情况下。最近的研究工作通常应用模型压缩技术，如量化、剪枝和合并，以限制MoE的复杂性。然而，由于它们预定义的静态模型优化策略，在处理多个请求时，它们不能总是实现所需的性能-开销折中，最终会降低设备上的服务质量。这些限制促使我们提出D$^2$MoE，这是一种算法-系统协同设计框架，通过动态分配最合适的比特宽度给每个专家来匹配多样的任务需求。具体来说，受套娃结构的启发，我们提出了套娃权重量化（MWQ）来渐进式地以比特嵌套的方式压缩专家权重并减少所需的运行时内存。在此之上，我们进一步优化了I/O-计算流水线，并根据我们的热点专家比特优先（HEBF）原则设计了一种启发式调度算法，该算法在受内存预算限制的情况下最大化I/O队列和计算队列之间的专家并行性，从而显著减少了等待专家加载时的闲置时间间隔泡。实际边缘设备上的评估表明，D$^2$MoE在比最新边缘设备推理框架高1.39倍的总体推理吞吐量下，将峰值内存占用量降低了53%，同时仍能保持与INT8同等的服务准确性。

发布时间: 4/23/2025

查看原文

基于云的AI推理服务中的可扩展性优化：实时负载均衡和自动化扩展策略

作者: Yihong Jin, Ze Yang

arXiv:2504.15296v1 宣告类型: cross 摘要: 云中快速扩展的AI推理服务需要一个稳健的扩展解决方案来管理动态工作负载并保持高性能。本研究提出了一种全面的云AI推理服务扩展优化框架，重点关注实时负载均衡和自动扩展策略。所提出的模型是一种混合方法，结合了强化学习进行自适应负载分布和深度神经网络进行准确的需求预测。这一多层次的方法使系统能够预测工作负载波动，并主动调整资源，确保资源利用率最大化并最小化延迟。此外，模型中包含去中心化的决策过程，以增强容错能力并减少扩展操作的响应时间。实验结果表明，所提出的模型通过提高负载均衡效率35% 和减少响应延迟28% 来显著优化效果，优于传统扩展解决方案。

发布时间: 4/23/2025

查看原文

CUBETESTERAI：使用LLaMA模型的自动化JUnit测试生成

作者: Daniele Gorla, Shivam Kumar, Pietro Nicolaus Roselli Lorenzini, Alireza Alipourfaz

arXiv:2504.15286v1 宣布类型: cross 摘要：本文提出了一种使用 Spring Boot 框架为 Java 应用程序自动化生成 JUnit 测试的方法，通过利用 LLaMA（大规模语言模型架构）模型来提高测试过程的效率和准确性。由此产生的工具称为 CUBETESTERAI，它包括一个用户友好的网页界面，并且集成了使用 GitLab 和 Docker 的 CI/CD 管道。这些组件简化了自动测试生成过程，使开发人员能够直接从代码片段生成 JUnit 测试，同时减少手动干预。最终实现是通过 RunPod 执行 LLaMA 模型，这是一个在线 GPU 服务，也提高了我们工具的隐私性。利用 LLaMA 模型的先进自然语言处理能力，CUBETESTERAI 能够生成具有高代码覆盖率且准确验证 Java 基础 Spring Boot 应用程序软件功能的测试用例。此外，它有效地管理了资源密集型操作，并对生成的测试进行了改进，以解决常见的问题，如缺少导入和处理私有方法。通过对 CUBETESTERAI 与一些最先进的工具进行比较，我们展示了我们的提案在不同的现实生活 Java 程序中在代码覆盖率方面始终表现出竞争力，在许多情况下甚至表现更好。

发布时间: 4/23/2025

查看原文