arXiv 论文列表

作者: Luyuan Zhang, Xidong Mu, An Liu, Yuanwei Liu

arXiv:2504.16099v1 类型: cross 摘要: 弯捏天线系统(Pinch Antenna Systems, PASS)已被提出作为一种革命性的柔性天线技术，它通过波导上的众多低成本可调激活位置的弯捏天线来实现视线链路。本文提出了一种双时间尺度联合发射和弯捏波束形成设计方法，以最大化基于PASS的下行多用户单输入多输出系统的总速率。开发了一种原始对偶分解方法，将双时间尺度问题分解为两个子问题：1) 提出了一个基于Karush-Kuhn-Tucker引导的对偶学习方法来解决短期发射波束形成设计子问题；2) 采用随机逐步凸近似方法解决长期弯捏波束形成设计子问题。仿真结果表明，所提出的方法与基线方法相比实现了显著的性能提升。

发布时间: 4/24/2025

查看原文

基于CNN的平均窗口嵌入局部-全局自注意力心电图分级分析

作者: Arthur Buzelin, Pedro Robles Dutenhefner, Turi Rezende, Luisa G. Porfirio, Pedro Bento, Yan Aquino, Jose Fernandes, Caio Santana, Gabriela Miana, Gisele L. Pappa, Antonio Ribeiro, Wagner Meira Jr

arXiv:2504.16097v1 类型: cross 摘要: 心血管疾病仍然是全球死亡的主要原因，强调了高效诊断工具的迫切需求，尤其是心电图（ECGs）。近年来，特别是变压器的深度学习进步，已经通过捕捉详细的波形特征以及整体节律模式，彻底变革了心电图分析。然而，传统的变压器在捕捉对准确心电图解释至关重要的局部形态特征方面面临挑战。我们提出了一种新的局部-全局注意力心电图模型（LGA-ECG），以解决这一局限性，将卷积归纳偏差与全局自我注意力机制相结合。我们的方法通过从重叠卷积窗口中获得的嵌入的平均值提取查询，从而实现精细的形态分析，同时通过整个序列中得到的关键和值得出的注意力机制来建模全局上下文。在CODE-15数据集进行的实验表明，LGA-ECG 在性能上超越了现有的最佳模型，并且消融研究验证了局部-全局注意力策略的有效性。通过捕捉ECG信号中的分层时序依赖关系和形态特征模式，此新设计展示了其在临床部署中进行稳健的心电图自动分类的潜力。

发布时间: 4/24/2025

查看原文

脑提示：多级脑提示增强以识别神经状况

作者: Jiaxing Xu, Kai He, Yue Tang, Wei Li, Mengcheng Lan, Xia Dong, Yiping Ke, Mengling Feng

arXiv:2504.16096v1 宣布类型: cross 摘要: 神经系统疾病，如阿尔茨海默病，诊断起来非常具有挑战性，特别是在早期阶段，症状与健康对照组极为相似。现有的脑网络分析方法主要集中在依赖成像数据的图模型上，这可能会忽略重要的非成像因素，从而限制模型的预测能力和可解释性。本文中，我们提出了BrainPrompt，这是一种创新的框架，通过将大型语言模型（LLMs）与知识驱动的提示结合，增强图神经网络（GNNs），使得能够更有效地捕捉复杂的非成像信息和外部知识，从而提高神经系统疾病识别的效果。BrainPrompt整合了三种类型的知识驱动提示：（1）区域水平提示，编码每个大脑区域的身份和功能，（2）受试者水平提示，结合人口统计信息，以及（3）疾病水平提示，捕捉疾病的时序进展。通过利用这些多层次的提示，BrainPrompt有效地利用了LLMs提供的知识增强的多模态信息，增强模型在预测神经系统疾病阶段的能力，同时提供了更具可解释性的结果。我们在两种静息态功能性磁共振成像（fMRI）数据集上评估了BrainPrompt，结果显示其优于最先进的方法。此外，一项生物标志物研究表明，该框架能够提取与神经科学领域知识相一致的有价值的、可解释的信息。

发布时间: 4/24/2025

查看原文

通过快速排序和布拉德利-泰尔模型进行偏好聚合的有效投资组合选择

作者: Yurun Ge, Lucas B\"ottcher, Tom Chou, Maria R. D'Orsogna

arXiv:2504.16093v1 类型:交叉摘要:如何将有限资源分配给能带来最大长期收益的项目是一个在不确定性决策中经常遇到的问题。例如，组织可能需要评估和选择具有风险回报的创新项目。同样地，在分配资源给研究项目时，资助机构的任务是根据特定标准识别最有可能的成功提案。最后，在参与式预算中，当地社区可能需要选择一部分公共项目来资助。无论是在什么背景下，代理人都必须估计大量项目的不确定价值。开发简洁的方法来比较这些项目，并汇总代理人的评估以最大化总体收益，在构建最佳项目组合方面至关重要。与标准排序算法不同，基于不确定的长期收益来评估项目引入了额外的复杂性。我们提出了基于快速排序和布拉德利-特里模型的比较规则，该模型将排名与一对项目的“胜出”概率联系起来。在我们的模型中，每个代理人都根据其对项目长期收益的特定评估来确定项目对之间的胜出概率。然后将这些胜出概率适当汇总并用于排名项目。我们提出的方法中的一些方法在目前最有效的几种汇总方法中表现更好。此外，我们的方法可以与采样技术结合使用，显著减少成对比较的数量。我们还讨论了如何在实践中实施布拉德利-特里投资组合选择方法。

发布时间: 4/24/2025

查看原文

AIMO-2 获胜方案：使用 OpenMathReasoning 数据集构建领先的数学推理模型

作者: Ivan Moshkov, Darragh Hanley, Ivan Sorokin, Shubham Toshniwal, Christof Henkel, Benedikt Schifferer, Wei Du, Igor Gitman

arXiv:2504.16891v1 项目类型: 新增摘要: 本文介绍了我们参加AI数学奥林匹克竞赛-进步奖(AIMO-2)的获胜提交方案。构建最先进的数学推理模型的关键在于三个方面。首先，我们创建了一个包含54万个高质量独特数学问题的大规模数据集，包括奥林匹克级别的问题及其320万个长推理解决方案。其次，我们开发了一种新颖的方法，通过迭代训练、生成和质量筛选将代码执行与长推理模型集成起来，从而生成170万个高质量工具集成推理解决方案。第三，我们创建了一个管道，用于训练模型从众多候选方案中选择最有前途的解决方案。我们展示了这样的生成性解决方案选择（GenSelect）可以显著改进多数投票基准。结合这些想法，我们训练了一系列模型，在数学推理基准测试中取得了最先进的成果。为了促进进一步的研究，我们在商业友好的许可下发布了我们的代码、模型和完整的OpenMathReasoning数据集。

发布时间: 4/24/2025

查看原文

轻量级潜在验证器以实现高效的元生成策略

作者: Bartosz Piotrowski, Witold Drzewakowski, Konrad Staniszewski, Piotr Mi{\l}o\'s

arXiv:2504.16760v1 公告类型: 新摘要: 验证器是辅助模型，用于评估由基础大型语言模型（LLMs）生成的输出的正确性。它们在使用LLMs解决推理密集型问题的各种策略中扮演着至关重要的角色。通常，验证器本身就是LLM，往往比它们支持的基础模型更大，使其在计算成本上较为昂贵。在这项工作中，我们引入了一种新颖的轻量级验证方法LiLaVe，它可以可靠地从基础LLM的隐藏状态中提取正确性信号。LiLaVe的一个关键优势是，它可以仅使用传统LLM验证器所需计算预算的一小部分进行操作。为了证明其实用性，我们将LiLaVe与流行的元生成策略（如best-of-n或自我一致性）结合起来。此外，我们设计了基于LiLaVe的新方法，如条件自我纠正或条件多数投票，这些方法显著提高了使用较小的LLMs进行生成任务的准确性和效率。我们的工作证明了从LLM的隐藏状态中提取潜在信息的有效性，并为推理密集型应用提供了可扩展且资源高效的解决方案。

发布时间: 4/24/2025

查看原文

AI代理协议综述

作者: Yingxuan Yang, Huacan Chai, Yuanyi Song, Siyuan Qi, Muning Wen, Ning Li, Junwei Liao, Haoyi Hu, Jianghao Lin, Gaowei Chang, Weiwen Liu, Ying Wen, Yong Yu, Weinan Zhang

arXiv:2504.16736v1 宣告类型: 新摘要：大型语言模型（LLMs）的快速发展已经在包括客户服务、内容生成、数据分析以及医疗保健在内的多种行业中广泛部署了LLM代理。然而，随着越来越多的LLM代理被部署，一个主要问题出现了：这些代理还没有标准化的方式与其他外部工具或数据源进行通信。这种缺少标准协议使得代理之间的协作和高效扩展变得困难，并限制了它们完成复杂现实世界任务的能力。一个统一的通信协议可以改变这一现状。它可以使得代理和工具之间的交互更加顺畅，促进合作，并促使集体智能的形成。本文提供了现有的LLM代理通信协议的系统概述。我们将它们分类为四大类，并进行分析以帮助用户和开发人员选择最适合特定应用的协议。此外，我们在多个关键维度上（如安全、扩展性和延迟）对这些协议进行了比较性能分析。最后，我们探讨了未来挑战，如这些协议如何适应和在快速演变的环境中生存，以及未来协议需要具备哪些特性以支持LLM代理生态系统的发展。我们期望这项工作能够为研究人员和工程师提供一个实用的参考，以设计、评估或集成强大的智能代理通信基础设施。

发布时间: 4/24/2025

查看原文

IRIS: 交互式研究构想系统，用于加速科学研究

作者: Aniketh Garikaparthi, Manasi Patwardhan, Lovekesh Vig, Arman Cohan

arXiv:2504.16728v1 宣告类型: 新摘要: 大型语言模型（LLMs）能力的迅速提升提出了一个关键问题：LLMs 如何加速科学发现？本文探讨了研究的第一关键阶段——生成新的假设。虽然最近在自动假设生成方面的研究集中在多智能体框架和扩展测试时计算方面，但没有任何方法能够通过协同的人工智能在环（HITL）方法有效地结合透明度和可控性。为了解决这一缺口，我们引入了 IRIS（Interactive Research Ideation System，互动研究构想系统）：一个为研究人员设计的开源平台，旨在利用 LLM 辅助的科学研究构想。IRIS 结合了创新功能来增强构想，包括通过蒙特卡洛树搜索（MCTS）进行自适应测试时计算扩展、细粒度反馈机制以及基于查询的文献合成。旨在使研究人员在整个构想过程中获得更多的控制权和洞察力。此外，我们还与来自不同学科的研究人员进行了用户研究，验证了我们的系统在增强构想方面的效果。我们在 https://github.com/Anikethh/IRIS-Interactive-Research-Ideation-System 开源了我们的代码。

发布时间: 4/24/2025

查看原文

经济计量学与人工智能的桥梁：通过强化学习和GARCH模型进行VaR估计

arXiv:2504.16635v1 宣告类型: 新摘要: 在金融市场日益波动的环境中，准确估计风险仍然是一个主要挑战。传统的经济计量模型，如GARCH及其变体，基于的假设往往过于僵化，难以适应当前市场动态的复杂性。为克服这些限制，我们提出了一种结合GARCH波动模型和深度强化学习的混合框架来估计风险价值(VaR)。我们的方法利用双深度Q网络(DDQN)模型进行市场方向预测，将任务视为不平衡分类问题。该架构能够根据市场条件动态调整风险水平的预测。在涵盖危机时期和高波动性的日交易Eurostoxx 50数据上进行的经验验证显示，VaR估计的准确性和违约次数的减少以及资本要求的降低都有显著提高，同时符合监管风险阈值。模型能够实时调整风险水平的能力突显了其在现代和主动风险管理中的相关性。

发布时间: 4/24/2025

查看原文

认知硅片：后工业计算系统的架构蓝图

作者: Christoforus Yoga Haryanto, Emily Lomempow

arXiv:2504.16622v1 自动化类型: 新摘要：自主人工智能系统揭示了确定性、由人类编写的计算架构的基本局限性。本文提出了认知硅：一种面向2035年的假设性全栈架构框架，探讨了认知计算系统设计的一种可能的发展轨迹。提出的架构将整合符号支撑结构、受控内存、运行时道德一致性以及跨硅到语义层的认知意识执行。我们的设计语法规则是从不对称认识条件下的LLM的辩证联合设计中浮现出来的，通过有结构的摩擦揭示盲点和权衡。设想的框架将确立死亡作为物理限制、不可复制的默会知识和不可克隆的身份密钥作为认知体认原始元素的自然结果。核心紧张关系（信任/自主性、支撑/涌现、执行/治理）将作为架构的压力中心，而不是边缘案例。该架构理论上与自由能量原则一致，可能提供一种关于如何通过预测错误最小化来跨越物理和计算边界维持认知系统身份的正式解释。最终框架旨在提供一种可道德准则进行导航的认知基础设施，这种基础设施能够通过不可逆转的硬件约束以及抵抗复制或篡改的身份绑定认识机制来维持人类一致性。

发布时间: 4/24/2025

查看原文