arXiv 论文列表

作者: Snehamoy Chatterjee, Greg Waite, Sidike Paheding, Luke Bowman

arXiv:2503.21803v1 致谢类型: cross 摘要: 预测火山活动对于灾害评估和风险减轻至关重要。火山辐射功率（VPR），源自热遥感数据，是火山活动的重要指标。在这项研究中，我们使用贝叶斯正则化神经网络（BRNN）根据费格奥火山的历史数据预测未来的VPR值，并将其性能与尺度共轭梯度（SCG）和莱文伯格-马夸特（LM）模型进行比较。结果显示，BRNN表现优于SCG和LM，实现了最低的均方误差（1.77E+16）和最高的R平方值（0.50），表明其在捕捉VPR变化的同时最大限度地减少了过拟合的能力。尽管取得了这些令人鼓舞的结果，仍需克服提高模型预测准确性的一些挑战。未来的研究应致力于结合更多的地质物理参数，如地震和气体排放数据，以提高预测精度。研究结果强调了机器学习模型，尤其是BRNN，对于推进火山活动预测的潜力，并有助于更有效的火山灾害预警系统。

发布时间: 3/31/2025

查看原文

多个未来词项的高效联合预测

作者: Kwangjun Ahn, Alex Lamb, John Langford

arXiv:2503.21801v1 交叉类型公告摘要：在本简要报告中，我们介绍了联合多令牌预测（JTP），这是一个基于标准下一项令牌预测的轻量级修改，旨在通过联合预测多个未来令牌来丰富隐藏状态表示。与之前的多令牌预测方法不同，JTP巧妙地通过精心设计的表示瓶颈利用未来令牌的教师强迫，使模型能够在训练过程中以最小的计算开销编码丰富的预测信息。我们展示了JTP方法能够实现短期视角的信念状态表示，而流行的多令牌预测替代方法则无法做到这一点。我们在Bachmann和Nagarajan[2024]的合成星图导航任务上展示了我们方法的有效性，显示出相对于现有方法的显著性能改进。本文呈现了有前景的初步结果，旨在刺激进一步的研究。

发布时间: 3/31/2025

查看原文

ELM：基于语言模型的肿瘤组预测ensemble方法用于病理报告

作者: Lovedeep Gondara, Jonathan Simkin, Shebnum Devji, Gregory Arbour, Raymond Ng

arXiv:2503.21800v1 交叉公告类型摘要：基于人口的癌症注册库（PBCRs）在手动从非结构化病理报告中提取数据方面面临一个重大瓶颈，这一过程对于肿瘤组分配等任务至关重要，处理大约10万份报告可能需要消耗900个人小时。为了应对这一挑战，我们引入了ELM（Ensemble of Language Models，语言模型集成），这是一种新颖的基于集成的方法，利用了小型语言模型（SLMs）和大型语言模型（LLMs）。ELM 利用了六种微调的 SLMs，其中三种 SLMs 使用病理报告的上部，三种 SLMs 使用病理报告的下部，这样做是为了最大化报告覆盖率。对于肿瘤组分类，ELM 要求六种模型中有五种达成一致。对于分歧，由一个经过慎重策划提示的 LLM 进行仲裁。我们在十九种肿瘤组的评估中展示了 ELM 的平均准确率和召回率达到了 0.94，优于单模型和未使用 LLM 的集成方法。在不列颠哥伦比亚癌症注册库部署后，ELM 展示了如何可以在 PBCR 设置中成功应用 LLMs，并取得最先进的成果，显著提高操作效率，每年节省数百个人小时。

发布时间: 3/31/2025

查看原文

一种用于具有复杂重叠的大规模全局优化的新型两阶段合作共进化框架

作者: Wenjie Qiu, Hongshu Guo, Zeyuan Ma, Yue-Jiao Gong

arXiv:2503.21797v1 共同进化类型：交叉摘要：通过分解问题空间，协同进化的关键方法是解决大规模全局优化问题的主要途径。通常，当子空间是不相交的时，与非分解算法相比，算法在有效性和效率上都表现出显著的优势。然而，当存在重叠变量时，分解过程会变得更加复杂，这对协同进化的性能产生了不良影响。在本研究中，我们提出了一种新的两阶段协同进化框架，以应对具有复杂重叠的大型全局优化问题。该框架中嵌入了一种基于数学性质的有效分解重叠问题的方法。此外，我们还引入了一个自定义的基准测试，以扩展现有的基准测试并方便实验。广泛的实验表明，在我们框架中实现的算法在性能上显著优于现有算法。结果揭示了重叠问题的特性，并突显了协同进化算法和非分解算法的不同优势。我们的工作是开源的，并可从以下链接访问：https://github.com/GMC-DRL/HCC。

发布时间: 3/31/2025

查看原文

脉冲网络中的阈值自适应能够实现最短路径寻找和地点辨析

作者: Robin Dietrich, Tobias Fischer, Nicolai Waniek, Nico Reeb, Michael Milford, Alois Knoll, Adam D. Hines

arXiv:2503.21795v1 类型: 跨领域摘要：高效的时空导航是哺乳动物大脑的一个标志性特征，激发了模仿生物原理的神经形态系统的开发。尽管取得了进步，但在生物启发的脉冲神经网络中实现关键操作（如回溯追踪）和处理模糊性仍然是一项开放的挑战。这项工作提出了一种机制，用于在任意单向脉冲神经元图中进行活动回溯追踪。我们通过我们的脉冲时序依赖阈值适应（STDTA）扩展了现有的脉冲层级时序记忆（S-HTM）的重演机制，这使我们能够在脉冲神经元网络中执行路径规划。我们还提出了一个依赖于模糊性的阈值适应（ADTA），用于识别环境中的模糊性较少的地方，以增强代理的定位估计。结合这些方法，可以在模糊性较少的目标位置高效地识别出最短路径。我们的实验表明，一个在序列上训练的网络可以使用较少的重演可靠地计算最短路径，所需步数少于达到目标所需的实际步骤。我们进一步证明，可以在多个相似的环境中识别出模糊性较少的地方。这些贡献将类似于S-HTM的生物启发顺序学习算法的实用应用推进到了神经形态定位和导航中。

发布时间: 3/31/2025

查看原文

信息架构

作者: Yurii Parzhyn

arXiv:2503.21794v1 类型: 交叉学科摘要：本文探讨了构建形式神经元和多层人工神经网络（ANN）能量景观的方法。通过对这些系统的分析，可以确定分类ANN（例如，MLP或CNN）和生成型ANN模型的概念局限性。对形式神经元和ANN模型的信息熵和热力学熵的研究得出结论，信息熵具有能量性质。应用吉布斯自由能的概念，可以将ANN的输出信息表示为焓的有序部分。将ANN建模为能量系统，使得可以将系统内部能量的结构解释为其对外部世界的内部模型，该模型基于系统内部能量组件的相互作用进行自我组织。通过对能量函数（类似于李雅普unov函数）的应用减缩运算，可以控制这种模型的自我组织和演化过程。这使得有可能引入一种新的直接学习方法来构建自我组织和进化的ANN，无需额外的外部算法。文中所呈现的研究使我们能够从系统内外能量交互过程的角度正式定义信息。

发布时间: 3/31/2025

查看原文

基于输入触发的硬件木马攻击针对脉冲神经网络

作者: Spyridon Raptis, Paul Kling, Ioannis Kaskampas, Ihsen Alouani, Haralampos-G. Stratigopoulos

arXiv:2503.21793v1 交叉公告类型: cross 摘要: 基于神经脉冲网络(SNNs)的神经形态计算正逐渐成为传统人工神经网络(ANNs)的一种有前途的替代方案，因其在低功耗方面具有独特的优势。然而，与ANNs的对应物相比，SNNs的安全性方面尚未得到充分探索。随着对AI系统的依赖增加，伴随着独特的安全风险和挑战，理解神经形态计算成熟过程中可能会遇到的漏洞和威胁 landscape 至关重要。在这一努力中，我们提出了一种针对SNNs的新型输入触发硬件特洛伊木马(HT)攻击。该HT机制集中在单一神经元的区域。触发机制是精心设计在神经脉冲域的输入信息，使选定的神经元产生一种不符合正常设置的恶意脉冲序列。该脉冲序列触发神经元中的恶意修改，迫使该神经元永久放电，在输入活动停止后也无法恢复到其静息状态。这些过度的脉冲污染了网络并产生误导性的决策。我们提出了一种选择合适的神经元并生成触发HT载荷的输入模式的方法。通过在神经形态社区流行的三个基准模拟中展示了该攻击。我们还提出了一种模拟脉冲神经元和数字SNN加速器的硬件实现，证明了HT几乎不会增加区域和功耗，因此可以轻松地逃避免检测。

发布时间: 3/31/2025

查看原文

March Madness 比赛预测模型：一个数学建模方法

作者: Christian McIver, Karla Avalos, Nikhil Nayak

arXiv:2503.21790v1 交叉公告类型摘要：本文提出了一种模型，基于2013年以来的NCAA篮球历史数据来预测March Madness锦标赛的结果。该项目框架是简化版的FiveThirtyEight NCAA March Madness预测模型，其中仅四个感兴趣的预测因子是调整后的进攻效率（ADJOE）、调整后的防守效率（ADJDE）、实力评分和两分球效率（允许）百分比。使用上述指标进行逻辑回归，以生成特定队伍赢得每场比赛的概率。然后，开发了锦标赛模拟，并将其与真实的March Madness淘汰赛比分进行比较，以确定模型的准确性。使用朴素方法和斯皮尔曼秩相关系数计算了性能的准确率。

发布时间: 3/31/2025

查看原文

从深度学习到大语言模型：定量投资中人工智能的综述

作者: Bokai Cao, Saizhuo Wang, Xinyi Lin, Xiaojun Wu, Haohan Zhang, Lionel M. Ni, Jian Guo

arXiv:2503.21422v1 宣告类型：交叉摘要：量化投资（quant）是一种在资产管理领域新兴的技术驱动方法，正日益受到人工智能进展的影响。在量化金融领域，深度学习和大型语言模型（LLMs）的最新进展提高了预测建模能力，并使基于代理的自动化成为可能，这表明了该领域可能发生的范式转变。在本文综述中，以阿尔法策略为例，我们探讨了人工智能如何影响量化投资管道。我们首先考察了量化研究的早期阶段，那时的研究主要集中在人工构造的特征和传统的统计模型，以及已经建立的阿尔法管道。然后，我们讨论了深度学习的发展，这使得从数据处理到订单执行的整个管道中的可扩展建模成为可能。在此基础上，我们强调大型语言模型在将人工智能应用扩展到预测之外所起的作用，使自主代理能够处理非结构化数据、生成阿尔法策略，并支持自我迭代的工作流程。

发布时间: 3/31/2025

查看原文

Mamba-3D作为遮蔽自编码器，用于准确高效的医学超声视频分析

作者: Jiaheng Zhou, Yanfeng Zhou, Wei Fang, Yuxing Tang, Le Lu, Ge Yang

arXiv:2503.20258v1 宣告类型: cross 摘要：超声波视频是临床成像数据的重要形式，基于深度学习的自动化分析可以提高诊断准确性和临床效率。然而，标注数据的稀缺性和视频分析固有的挑战阻碍了相关方法的发展。在这项工作中，我们引入了E-ViM$^3$，这是一种数据高效、保留视频数据3D结构的Vision Mamba网络，通过增强长期依赖性和归纳偏置，更好地建模时空相关性。通过我们设计的封装全局令牌(EGT)，该模型比竞争方法更有效地捕捉和聚合全局特征。为了进一步提高数据效率，我们采用了掩蔽视频建模进行自我监督的预训练，并提出了Spatial-Temporal Chained (STC) 遮蔽策略，该策略能够适应各种视频场景。实验结果表明，E-ViM$^3$ 在四个不同大小数据集（EchoNet-Dynamic、CAMUS、MICCAI-BUV 和 WHBUS）上的两个高层次语义分析任务中表现出了最先进的性能。此外，我们的模型在有限标签的情况下实现了竞争力的表现，突显了其在实际临床应用中的潜在影响。

发布时间: 3/31/2025

查看原文