arXiv 论文列表

作者: Kelsey E. Ennis, Elizabeth A. Barnes, Marybeth C. Arcodia, Martin A. Fernandez, Eric D. Maloney

arXiv:2504.21195v1 交叉公告类型摘要：极端高温是美国与天气相关的最具致命性的灾害。此外，极端高温的强度、频率和持续时间都在增加，使得准确的预报对保护生命和财产至关重要。传统的数值天气预测（NWP）模型在中短期和亚季节到季节尺度（S2S）的极端高温预测方面存在困难。与此同时，基于人工智能的天气预测（AIWP）模型正在迅速进步。然而，人们对AIWP模型在极端天气预测，尤其是中短期和S2S尺度上的表现知之甚少。本研究评估了两种AIWP模型（Google GraphCast和Pangu-Weather）和一种传统NWP模型（NOAA统一预报系统全球集合预报系统（UFS GEFS））对四个北半球季节和四个CONUS地区60次热浪的2米温度预测，时间跨度长达20天。结果显示，在热浪发生前5-10天的时间范围内，这两种AIWP模型和UFS GEFS都表现出区域尺度上的冷偏差。GraphCast在大多数地点比UFS GEFS和Pangu-Weather更准确。接着，分析了两个AIWP模型在所有热浪和季节中的表现，事件被分为模型的测试期（2018-2023）和训练期（1979-2017）。两种模型和所有季节在热浪前和期间都存在冷偏差，除了冬季的Pangu-Weather，在热浪发生前表现出平均暖偏差。总体而言，结果表明AIWP模型可能在中短期和S2S尺度上预测极端高温方面具有应用潜力。

发布时间: 5/1/2025

查看原文

基于ISS的地球影像地理定位：结合宇航员摄影与机器学习的地理映射增强技术

作者: Vedika Srivastava, Hemant Kumar Singh, Jaisal Singh

arXiv:2504.21194v1 交叉公告类型摘要：本文提出了一种使用先进机器学习算法对国际空间站(ISS)拍摄的图像进行地理定位的新方法。尽管精确的ISS坐标是已知的，但宇航员拍摄的照片中所显示的具体地球位置往往仍然未被识别。我们通过采用三种不同的图像处理流水线来解决这一问题：基于神经网络的方法、基于SIFT的方法，以及GPT-4模型。每条流水线都专门用于处理高分辨率ISS图像，能够识别自然和人造地理特征。通过在包含超过140张ISS图像的多样化数据集上进行广泛的评估，我们的方法展示出在自动化地理定位方面具有显著的潜力，尽管不同方法的成功率各不相同。神经网络方法在准确匹配地理特征方面显示出高成功率，而SIFT流水线在处理放大图像方面表现出色。GPT-4模型则提供了丰富的地理描述以及位置预测。这项研究为遥感和地球观测领域做出了贡献，通过提高基于太空的图像地理定位的准确性和效率，从而有助于环境监测和全球制图努力。

发布时间: 5/1/2025

查看原文

小的还是大的？零样本还是微调？指导面向医疗健康领域专业化应用的语言模型选择

作者: Lovedeep Gondara, Jonathan Simkin, Graham Sayle, Shebnum Devji, Gregory Arbour, Raymond Ng

arXiv:2504.21191v1 宣告类型: 横跨领域摘要：本研究旨在通过调查以下方面来指导语言模型的选择：1）微调与零样本使用的必要性，2）领域相邻预训练模型与通用预训练模型的益处，3）进一步领域特定预训练的价值，以及4）小型语言模型（SLMs）与大型语言模型（LLMs）在特定任务中持续的相关性。使用不列颠哥伦比亚癌症登记处（BCCR）的电子病理报告，本研究评估了三种不同难度和数据量的分类场景。模型包括各种SLMs和一个LLM。SLMs在零样本和微调两种情况下进行评估；LLM仅在零样本情况下进行评估。与零样本结果相比，微调显著提升了所有场景中SLMs的性能。零样本的LLM在所有场景中均优于零样本的SLMs，但始终被微调的SLMs所超越。经过微调的领域相邻SLMs在所有场景中普遍优于通用预训练的SLMs，特别是在更难的任务中表现更加突出。进一步的领域特定预训练在较简单任务中提供了适度的性能提升，但在复杂的、数据稀缺的任务中则取得了显著改善。结果突显了在专门领域中对SLMs进行微调对于改进其性能的关键作用，使其能够在针对特定分类任务时超越零样本LLMs的表现。在领域相邻或特定领域数据上的预训练提供了进一步的优势，特别是在复杂问题或有限的微调数据情况下。尽管LLMs提供了强大的零样本能力，但它们在这项特定任务中的表现并未达到适当微调的SLMs的水平。在LLMs的时代，SLMs仍然具有相关性和有效性，提供了一种相较于LLMs更具性能-资源优势的替代方案。

发布时间: 5/1/2025

查看原文

TT-LoRA MoE: 结合参数高效微调和稀疏混合-of-专家

作者: Pradip Kunwar, Minh N. Vu, Maanak Gupta, Mahmoud Abdelsalam, Manish Bhattarai

arXiv:2504.21190v1 Announce Type: cross 摘要：我们提出了张量训练低秩适配专家混合（TT-LoRA MoE）这一新颖的计算框架，该框架结合了参数高效微调（PEFT）与稀疏MoE路由，以应对大规模模型部署中的可扩展性挑战。与传统MoE方法不同，后者在专家数量增加时面临显著的计算 overhead，TT-LoRA MoE 将训练过程分解为两个独立且优化的阶段。首先，我们独立训练轻量级的张量化低秩适配器（TT-LoRA专家），每个适配器专门针对特定任务。随后，这些专家适配器保持冻结状态，从而在多任务设置中消除任务间干扰并防止灾难性遗忘。一个单独训练的稀疏MoE路由器根据输入动态利用基础模型表示，选择每个输入的精确一个专门的适配器，实现了无需显式指定任务的专家选择自动化。全面的实验验证了我们的架构保持了低秩适配器的内存效率，可以无缝扩展到大型专家池，并实现稳健的任务级优化。这种结构化的解耦显著提升了计算效率和灵活性：仅使用LoRA参数的2%，适配器参数的0.3%，以及适配器融合参数的0.03%，并在多任务场景中比适配器融合高出4个值，使得其实用且可扩展的多任务推理部署成为可能。

发布时间: 5/1/2025

查看原文

个人化预测阿兹海默症 progression 的人工智能方法：挑战与未来方向综述

作者: Gulsah Hancerliogullari Koksalmis, Bulent Soykan, Laura J. Brattain, Hsin-Hsiung Huang

arXiv:2504.21189v1 Announce Type: cross 摘要：阿尔茨海默病（AD）在其进展过程中表现出显著的个体间异质性，这使准确的预后和个性化护理计划变得更加复杂。这种异质性突显了需要具备预测能力的模型的重要性，这些模型能够预测患者的个性化疾病轨迹。人工智能（AI）通过分析复杂、多模态和纵向的患者数据，提供了应对这一挑战的强大工具。本文提供了将AI方法应用于个性化AD进展预测的全面综述。我们回顾了包括状态空间模型以捕捉时间动态，循环神经网络（RNN）等深度学习技术以进行序列建模，图神经网络（GNN）以利用网络结构，以及新兴的人工智能驱动数字双胞胎概念以进行个性化模拟的关键方法。认识到数据限制常常阻碍进展，我们考察了常见的挑战，如高维度、缺失数据和数据集不平衡。此外，我们讨论了AI驱动的缓解策略，特别是使用变分自编码器（VAEs）和生成对抗网络（GANs）生成合成数据以增加和平衡数据集的方法。综述综合了当前方法的优势和局限性，强调了多模态整合的趋势以及模型解释性和适应性持续需求的重要性。最后，我们指出了关键的开放挑战，包括稳健的外部验证、临床整合和伦理考量，并概述了未来研究的有希望的方向，如混合模型、因果推断和联邦学习。此次综述旨在汇总当前的知识，并指导未来努力开发对个性化AD预后有临床意义的AI工具。

发布时间: 5/1/2025

查看原文

轻量级 CNN 在 MRI 图像中脑肿瘤分类中的应用

作者: Natnael Alemayehu

arXiv:2504.21188v1 交叉公告类型：交叉摘要：本文提出了一种基于卷积神经网络（CNN）的方法，用于利用磁共振成像（MRI）扫描进行脑肿瘤的多类分类。我们利用一个公开可用的数据集，其中包含按四类分类的MRI图像：胶质瘤、脑膜瘤、垂体瘤和无肿瘤。我们的主要目标是构建一个轻量级的深度学习模型，能够自动以高精度分类脑肿瘤类型。为了实现这一目标，我们引入了图像预处理步骤，包括标准化、数据增强和一种旨在减少背景噪声和强调相关区域的裁剪技术。通过对超参数进行调优（使用Keras Tuner优化CNN架构），使网络参数的系统探索成为可能。为了确保可靠的评估，我们应用了5折交叉验证，其中每个超参数配置都在多个数据分割上评估，以减轻过拟合问题。实验结果表明，所提出模型的分类准确率为98.78%，表明其在临床环境中作为诊断辅助工具的潜力。提出的方法提供了一种低复杂度而有效的解决方案，以辅助早期脑肿瘤诊断。

发布时间: 5/1/2025

查看原文

使用Laban运动分析的舞蹈风格识别

作者: Muhammad Turab, Philippe Colantoni, Damien Muselet, Alain Tremeau

arXiv:2504.21166v1 种类: cross 摘要: 随着对自动化运动分析的兴趣日益增加，这为识别复杂的人类活动（包括舞蹈）提出了新的挑战。本研究专注于使用 Laban 运动分析提取的特征进行舞蹈风格识别。此前的舞蹈风格识别研究通常侧重于跨帧运动分析，这限制了捕捉运动间的时间上下文和动态过渡的能力。这一差距突显了需要一种方法来为 LMA 特征添加时间上下文的必要性。为此，我们提出了一种新的管道，该管道结合了三维姿态估计、三维人体网格重建以及地面感知的身体建模，以有效提取 LMA 特征。为了解决时间限制问题，我们提出了一种滑动窗口方法，该方法能够捕捉特征中随时间变化的动作演变。然后使用这些特征训练各种机器学习方法进行分类，并使用可解释的人工智能方法评估每个特征对分类性能的贡献。我们提出的方法达到了最高的分类准确率 99.18%，这表明添加时间上下文显著提高了舞蹈风格识别的性能。

发布时间: 5/1/2025

查看原文

Grad-Shafranov 方程的物理导向神经网络模型的评估与验证

作者: Fauzan Nazranda Rizqa, Matthew Hole, Charles Gretton

arXiv:2504.21155v1 宣传类型：交叉摘要：我们的贡献受到依赖于维持磁流体动力平衡（MHD 平衡）的聚变反应堆的启发，在这种平衡中，等离子体压力和束缚磁场之间的平衡对于稳定操作是必要的。特别是在特定的柱对称托卡马克反应堆中，假设其具有托尔曼对称性时，这种平衡可以用 Grad-Shafranov 方程（GSE）进行数学建模。近期的研究表明，使用物理信息神经网络（PINNs）来建模 GSE 的潜力。现有的研究没有探讨单一网络如何在各种边界条件下泛化的情况。为了解决这一局限性，我们评估了一种将边界点作为网络输入的 PINN 架构。此外，我们将 PINN 模型的准确性和推理速度与傅里叶神经算子（FNO）模型进行了比较。尽管我们在 PyTorch 中原生评估网络时与通过 Marabou 评估的有些差异，但我们能够展示出有用的实用验证工作流程。我们的研究是首次对这类网络进行验证的调查。

发布时间: 5/1/2025

查看原文

当代舞蹈表演中的情绪识别：基于拉班动律分析

作者: Muhammad Turab, Philippe Colantoni, Damien Muselet, Alain Tremeau

arXiv:2504.21154v1 交叉公告类型：交叉摘要：本文提出了一种用于当代舞蹈情感识别的新框架，通过对现有的拉班运动分析（LMA）特征描述符进行改进，并引入了能捕捉运动定量和定性方面的稳健的新描述符。我们的方法从各种情绪状态下专业舞者进行的当代舞蹈的3D关键点数据中提取表现性特征，并训练了包括随机森林和支持向量机在内的多个分类器。此外，我们还使用可解释的机器学习方法提供了对特征及其对模型预测影响的深入解释。总体而言，我们的研究提高了当代舞蹈情感识别的水平，并在表演分析、舞蹈训练和人机交互方面提供了令人鼓舞的应用前景，最高准确率达到96.85%。

发布时间: 5/1/2025

查看原文

SMOGAN：带有GAN精炼的合成少数类过采样算法用于不平衡回归

作者: Shayan Alahyari, Mike Domaratzki

arXiv:2504.21152v1 宣布类型: 横跨领域摘要：不平衡回归是指目标变量分布偏斜的预测任务。这种偏斜阻碍了机器学习模型，尤其是神经网络，这些模型倾向于集中在密集区域，因此在欠代表（少数）样本上表现较差。尽管这个问题非常重要，但只有少数方法被提出用于不平衡回归。许多现有的不平衡回归解决方案通过将类不平衡领域的技术，如线性插值和添加高斯噪声，应用于稀疏区域以生成合成数据。然而，在许多情况下，数据的潜在分布是复杂的和非线性的。因此，这些方法生成的合成样本无法准确反映真实的特征-目标关系。为克服这些局限性，我们提出SMOGAN，一种两阶段的过采样框架用于不平衡回归。在第一阶段，现有的过采样器在稀疏的目标区域生成初始合成样本。在第二阶段，我们引入DistGAN，一种基于分布的生成对抗网络，作为SMOGAN的筛选层，并通过对抗损失和最大均值偏差目标相结合进行这些样本的精细化处理，使它们与真实的特征-目标联合分布对齐。对23个不平衡数据集的广泛实验表明，SMOGAN在不使用DistGAN筛选层的情况下，始终优于默认的过采样方法。

发布时间: 5/1/2025

查看原文