arXiv 论文列表

作者: Ibrahim Bouabdallaoui, Fatima Guerouate, Samya Bouhaddour, Chaimae Saadi, Mohammed Sbihi

arXiv:2502.02391v1 交叉类型公告：摘要：我们介绍了FewTopNER，这是一种新颖的框架，将少量样本命名实体识别（NER）与主题感知上下文建模相结合，以应对跨语言和低资源场景中的挑战。FewTopNER 利用基于 XLM-RoBERTa 的多语言共享编码器，并通过语言特定的校准机制进行增强，生成稳健的上下文嵌入。该架构包括一个基于原型的实体识别分支，采用双向 LSTM 和条件随机场进行序列标注，以及一个通过混合概率与神经方法提取文档级别语义特征的主题建模分支。跨任务桥梁在实体和主题表示之间促进动态双向注意和特征融合，从而通过引入全局语义上下文来增强实体消歧。在英语、法语、西班牙语、德语和意大利语的多语言基准数据集上的实证评估表明，FewTopNER 显著优于现有少数样本 NER 模型。特别是，在 F1 分数上，该框架取得了 2.5-4.0 个百分点的改进，并且在归一化点互信息衡量的主题连贯性方面表现出增强。消融研究进一步证实了共享编码器和跨任务集成机制对整体性能的关键贡献。这些结果强调了将主题感知上下文纳入少数样本 NER 的有效性，并突显了FewTopNER 在低资源环境中的稳健跨语言应用的潜力。

发布时间: 2/5/2025

查看原文

CoAT: 增强大型语言模型推理能力的关联思考链框架

作者: Jianfeng Pan, Senyou Deng, Shaomang Huang

arXiv:2502.02390v1 类别: cross 摘要: LLM技术的研究正迅速兴起，大多数研究采用“快速思考”推理方法。大多数LLM仅基于单个查询和LLM的推理能力生成最终结果。然而，随着OpenAI-o1的出现，“慢思考”技术正逐渐受到关注，因为其过程更接近人类的思考过程。受人类在思考过程中不断关联和补充知识的能力启发，我们开发了新颖的Chain-of-Associated-Thoughts (CoAT)框架，该框架引入了蒙特卡洛树搜索（MCTS）算法和一种新的动态机制，称为“关联记忆”，用于整合新关键信息。通过将MCTS的结构化探索能力与关联记忆的自适应学习能力相结合，CoAT显著扩大了LLM的搜索空间，使我们的框架能够探索多种推理路径，并在实时更新其知识库。这使框架不仅能够重访和精细化先前的推理，还能适应性地纳入不断变化的信息，确保最终输出既准确又全面。为了验证我们框架的有效性，我们在一系列生成性和推理性任务中进行了广泛实验。这些实验表明，我们的框架在准确度、连贯性和多样性方面优于传统的推理过程。框架能够在保留相关上下文信息的同时，迭代扩展其搜索空间。

发布时间: 2/5/2025

查看原文

液体民主的成本 Perspective: 可行性与控制

作者: Shiri Alouf-Heffetz, {\L}ukasz Janeczko, Grzegorz Lisowski, Georgios Papasotiropoulos

arXiv:2502.02380v1 宣布类型:交叉摘要:我们探讨了一个基于批准的液态民主模型，该模型在投票和委托成本上设定了预算约束，旨在集中选择投票者以确保选民的完全代表。从计算复杂性的角度来看，我们关注的是最小化总体成本、保持短委托路径以及防止投票权过度集中。此外，我们还研究了战略控制的计算方面，具体来说，外部代理是否可以更改选举组件以影响某些选民的投票权。

发布时间: 2/5/2025

查看原文

MaintaAvatar：基于持续学习的神经辐射场驱动的可维护化身

作者: Shengbo Gu, Yu-Kun Qiu, Yu-Ming Tang, Ancong Wu, Wei-Shi Zheng

arXiv:2502.02372v1 类型: cross 摘要：虚拟数字头像的生成是计算机视觉领域的一个关键研究课题。许多现有工作利用神经辐射场（NeRF）来解决这一问题，并取得了令人印象深刻的结果。然而，之前的许多工作假设训练人的图像已知且固定，而在现实世界中，主题的外观和姿态可能会不断变化和增加。如何更新人类头像同时保持渲染旧人外观的能力是一项实际挑战。一个简单的解决方法是结合基于 NeRF 的现有虚拟头像模型与持续学习方法。然而，这种方法存在一些关键问题：学习新的外观和姿态可能会导致模型忘记过去的信息，进而导致过去外观的渲染质量下降，特别是色彩溢出问题，以及不正确的人体姿态。在这项工作中，我们提出了一种基于持续学习的神经辐射场的可维护头像（MaintaAvatar），通过利用全局-局部联合存储模块和姿态蒸馏模块来解决这些问题。总体而言，我们的模型只需要少量数据收集即可迅速微调模型，同时避免灾难性遗忘，从而实现可维护的虚拟头像。实验结果验证了我们MaintaAvatar模型的有效性。

发布时间: 2/5/2025

查看原文

基于结合位点无关的对接中的精确口袋识别

作者: Yaroslav Balytskyi, Inna Hubenko, Alina Balytska, Christopher V. Kelly

arXiv:2502.02371v1 Announce Type: cross 摘要：准确识别可药物化位点对于结构基于的药物设计至关重要。然而，大多数位点识别算法更注重几何特性而忽略了下游对接性能。为了解决这一限制，我们开发了 RAPID-Net，这是一种无缝集成到对接工作流中的位点发现算法。当指导 AutoDock Vina 时，RAPID-Net 在 PoseBusters 基准测试中优于 DiffBindFR，并且使 AlphaFold 3 无法整体处理的大蛋白实现了盲对接。此外，RAPID-Net 在 PoseBusters、Astex 多样化集合、BU48 和 Coach420 等多种数据集上均优于 PUResNet 和 Kalasanty，在对接准确性和位点-配体交集率方面表现更佳。当准确性评估为“构象集中的至少一个正确构象”时，RAPID-Net 在 PoseBusters 基准测试中表现优于 AlphaFold 3，表明我们的方法可以在合适的构象重新加权工具的支持下进一步改进，为对接提供一种成本效益高且具竞争力的替代方案。最后，通过几个具有治疗相关性的例子，我们展示了 RAPID-Net 识别远程功能位点的能力，突显了其在促进创新药物开发方面潜在的作用。

发布时间: 2/5/2025

查看原文

评估大型语言模型在修复真实项目中的可维护性问题方面的有效性

作者: Henrique Nunes, Eduardo Figueiredo, Larissa Rocha, Sarah Nadi, Fischer Ferreira, Geanderson Esteves

arXiv:2502.02368v1 类型: cross 摘要：大型语言模型（LLMs）在解决编码问题方面引起了关注，但它们在修复代码可维护性方面的有效性仍有待澄清。本研究评估了LLMs修复来自10个GitHub仓库的127个可维护性问题的能力。我们使用零样本提示对Copilot Chat和Llama 3.1进行评估，而仅对Llama使用少量样本提示。对于生成的解决方案，我们评估了其编译错误、测试失败和新引入的可维护性问题。带有少量样本提示的Llama成功修复了44.9%的方法，而Copilot Chat和Llama零样本提示分别修复了32.29%和30%。然而，大多数生成的解决方案引入了错误或新的可维护性问题。我们还对45名参与者进行了一个关于51个LLM生成的解决方案可读性的评估研究。该研究显示，68.63%的参与者观察到了可读性的改善。总体而言，尽管LLMs展示了修复可维护性问题的潜力，但它们引入的错误也揭示了它们当前的局限性。

发布时间: 2/5/2025

查看原文

场匹配：一种电场 paradigm 生成和转移数据的方法

作者: Alexander Kolesov, Manukhov Stepan, Vladimir V. Palyulin, Alexander Korotin

arXiv:2502.02367v1 宣告类型: cross 摘要: 我们提出了一种名为电场匹配（EFM）的新方法，适用于生成建模和分布转移任务。我们的方法灵感源自电容器的物理原理。我们在电容器的电极上放置源分布和目标分布，并分别赋予它们正电荷和负电荷。然后，我们使用神经网络逼近器学习电容器的电场。为了将这些分布映射到对方，我们从电容器的一个电极开始，沿着学到的电场线移动样本，直到它们到达另一个电极。从理论上讲，我们证明了这种方法一定能实现分布转移。实际上，我们通过玩具数据和图像数据实验演示了EFM的性能。

发布时间: 2/5/2025

查看原文

4D 医学图像插值的测试时训练

作者: Qikang Zhang, Yingjie Lei, Zihao Zheng, Ziyang Chen, Zhonghao Xie

arXiv:2502.02341v1 宣告类型: cross 摘要：4D 医学图像插值对于提高临床应用中的时间分辨率和诊断精度至关重要。以往的工作忽略了分布偏移的问题，导致在不同分布下的泛化能力较差。自然的解决方法是将模型适应到新的测试分布，但这在没有标注信息的情况下无法实现。在本文中，我们提出了一种新颖的测试时训练框架，该框架使用自监督来在不需要任何标签的情况下将模型适应到新的分布。实际上，在对每个测试视频进行帧插值之前，模型将使用自监督任务（如旋转预测或图像重建）在同一样本上进行训练。我们在这两个公开的 4D 医学图像插值数据集 Cardiac 和 4D-Lung 上进行了实验。实验结果表明，所提出的方法在两个数据集的所有评估指标上都取得了显著的性能。该方法在 Cardiac 上实现了 33.73dB 的更高信噪比峰值值，在 4D-Lung 上实现了 34.02dB 的更高信噪比峰值值。我们的方法不仅推进了 4D 医学图像插值，还为图像分割和图像配准等其他领域的领域适应提供了一个模板。

发布时间: 2/5/2025

查看原文

EdgeGFL：图特征偏好学习中边信息的重新思考

作者: Shengda Zhuo, Jiwang Fang, Hongguang Lin, Yin Tang, Min Chen, Changdong Wang, Shuqiang Huang

arXiv:2502.02302v1 出版类型: cross 摘要: 图神经网络（GNNs）在处理非欧几里得数据方面具有显著优势，并已在多个领域得到广泛应用，因此近年来受到了越来越多的关注。GNN模型的框架主要包含信息传播阶段和聚合阶段，分别将节点和边视为信息实体和传播通道。然而，现有的大多数GNN模型面临节点和边特征信息脱节的挑战，因为这些模型通常将边特征和节点特征的学习视为独立的任务。为了克服这一局限性，我们旨在开发一种以边为中心的图特征偏好学习框架，能够捕捉边嵌入以辅助节点嵌入。通过利用学习到的多维边特征矩阵，我们构造多通道滤波器，更有效地捕捉准确的节点特征，从而获取非局部的结构性特征和精细的高阶节点特征。具体来说，多维边信息的引入增强了GNN模型的功能性和灵活性，使其能够更好地处理复杂多样的图数据。此外，将关系表示学习整合到消息传递框架中，使图节点能够接收到更多有用的信息，从而促进节点表示学习。最后，在四个现实世界异质图上的实验验证了所提模型的有效性。

发布时间: 2/5/2025

查看原文

FRAUD-RLA：一种针对信用 card 诈骗检测的新型强化学习对抗攻击

作者: Daniele Lunghi, Yannick Molinghen, Alkis Simitsis, Tom Lenaerts, Gianluca Bontempi

arXiv:2502.02290v1 宣告类型: cross 摘要: 敌对攻击对数据驱动系统构成了重大威胁，研究人员投入了大量资源研究它们。尽管具有重要的经济意义，这一趋势在很大程度上忽视了信用卡欺诈检测的问题。为了解决这一差距，我们提出了一种新的威胁模型，展示了现有攻击的局限性，并强调了调查新方法的必要性。然后，我们为信用卡欺诈检测设计了一种新的敌对攻击，使用强化学习绕过分类器。这种攻击称为FRAUD-RLA，旨在通过优化探索与利用的权衡来最大化攻击者的奖励，并且所需的知识远少于竞争对手。我们的实验在三个不同的异构数据集上进行，并对两种欺诈检测系统进行测试，结果显示即使在我们的威胁模型施加的严重限制下，FRAUD-RLA 也是有效的。

发布时间: 2/5/2025

查看原文