arXiv 论文列表

作者: Xing Liufu, Chaolei Tan, Xiaotong Lin, Yonggang Qi, Jinxuan Li, Jian-Fang Hu

arXiv:2412.12892v3 宣告类型: replace-cross 摘要：边缘标签通常由于标注者不同的偏好而处于不同的细粒度级别，因此处理像素级标签的主观性一直是边缘检测的一个重点。以往的方法往往采用简单的投票策略来减少这种标签不确定性，或者对标签施加一个强先验假设，例如高斯分布。在本工作中，我们揭示出段一切模型（SAM）提供了强大的先验知识来建模边缘标签中的不确定性。我们的主要洞察是，SAM的中间特征本质上对应于不同细粒度级别的对象边缘，这反映了由于不确定性而产生的不同边缘选项。因此，我们尝试通过从不同层回归中间SAM特征到多粒度级别的对象边缘来对齐不确定性与粒度。通过这种方式，模型可以以数据驱动的方式全面且明确地探索各种“不确定性”。具体而言，我们向冻结的SAM中注入了一个轻量级模块（约额外1.5%的参数），逐步融合和适应其中间特征，从粗到细估计边缘。将人类边缘标签的粒度规范化，以匹配其固有的不确定性至关重要。为此，我们简单地对手头的实际边缘标签进行线性混合，以创建具有不同粒度的伪标签。因此，我们的与不确定性对齐的边缘检测器可以灵活地在任何所需粒度（包括最优粒度）下生成边缘。得益于SAM，我们的模型在跨数据集边缘检测中展示了独特的强泛化能力。在BSDS500、Muticue和NYUDv2上的广泛实验结果验证了我们模型的优势。

发布时间: 4/22/2025

查看原文

分层拆分联邦学习：收敛性分析与系统优化

作者: Zheng Lin, Wei Wei, Zhe Chen, Chan-Tong Lam, Xianhao Chen, Yue Gao, Jun Luo

arXiv:2412.07197v2 宣告类型: replace-cross 摘要：随着AI模型的不断扩大，将联邦学习（FL）部署到资源受限的边缘设备上变得越来越具有挑战性。为解决这一问题，分拆联邦学习（SFL）作为一种通过模型拆分减少边缘设备工作量的FL框架，近年来引起了研究社区的广泛注意。然而，大多数关于SFL的先前工作仅关注两层架构，而未能充分利用多层云计算资源。在本文中，我们旨在分析和优化在多层系统下SFL的学习性能。具体而言，我们提议了分层SFL（HSFL）框架，并推导出了其收敛界。基于理论结果，我们制定了一个联合优化问题，用于模型拆分（MS）和模型聚合（MA）。为了解决这个问题，我们将其分解为可以通过迭代下降算法分别求解的MS和MA子问题。仿真结果表明，定制的算法可以有效地在几乎所有多层系统内优化SFL中的MS和MA。

发布时间: 4/22/2025

查看原文

训练神经网络而无需反向传播的粒子方法

作者: Deepak Kumar

arXiv:2412.05667v3 宣布类型: replace-cross 摘要：神经网络是一组在多层中堆叠起来的神经元，以模仿人类大脑中的生物神经元。神经网络已经使用基于梯度下降策略的反向传播算法进行了几十年的训练。已经开发出多种变体以改进反向传播算法。神经网络中的损失函数通过反向传播进行优化，但在构建的神经网络流形中存在多个局部最小值。我们获得了与这些局部最小值匹配的多个解。梯度下降策略无法避免局部最小值的问题，由于初始化的原因而卡在局部最小值中。粒子群优化（PSO）被提出，以在损失函数的搜索空间中选择最优的局部最小值。搜索空间仅限于PSO算法中的实例粒子，有时无法选择最佳解。在本方法中，我们通过分别训练单个神经元来克服梯度下降和PSO算法的限制，从而作为一组神经元形成的网络集体解决问题。我们的代码和数据可在https://github.com/dipkmr/train-nn-wobp/ 获取。

发布时间: 4/22/2025

查看原文

破框作画：用于视觉定位的合成与选择训练数据

作者: Zilin Du, Haoxin Li, Jianfei Yu, Boyang Li

arXiv:2412.00684v2 Announce Type: replace-cross 摘要：视觉定位旨在根据文本查询 localization 的图像区域。鉴于大规模数据整理的难度，本文探讨了在数据稀缺设置下如何有效学习视觉定位。为了解决数据稀缺性，我们提出了一种新的框架 POBF（在盒外绘画并筛选）。POBF 通过在盒子外进行 inpainting 合成图像，解决了之前工作中遇到的标签对齐问题。此外，POBF 利用了一种创新的筛选方案来选择最具效用的训练数据。该方案结合了难度评分和过拟合评分，并通过惩罚项进行平衡。跨四个基准数据集的广泛实验表明，POBF 一致地提高了性能，在仅使用真实数据的方法上平均提升了 5.83%，并在准确性上优于领先基准 2.29%-3.85%。此外，我们验证了 POBF 在各种生成模型、训练数据规模和模型架构下的稳健性和通用性。

发布时间: 4/22/2025

查看原文

星注意：高效处理长序列的LLM推理

作者: Shantanu Acharya, Fei Jia, Boris Ginsburg

arXiv:2411.17116v2 宣告类型：replace-cross 摘要：基于Transformer的大语言模型（LLMs）在长序列上的推理既昂贵又慢，原因在于自我注意力机制的二次复杂度。我们引入了一种两阶段的块稀疏近似方法——Star Attention，通过在多个主机之间划分注意力来提高计算效率，同时最小化通信开销。在第一阶段，上下文通过主机之间的块局部注意力并行处理。在第二阶段，查询和响应标记通过序列全局注意力关注所有先前缓存的标记。Star Attention 无缝集成了大多数使用全局注意力训练的基于Transformer的大语言模型，将内存需求和推理时间分别减少多达11倍，同时保持97-100%的准确性。

发布时间: 4/22/2025

查看原文

基于自我监督去噪的鲁棒多线圈MRI重建

作者: Asad Aali, Marius Arvinte, Sidharth Kumar, Yamin I. Arefeen, Jonathan I. Tamir

arXiv:2411.12919v2 宣告类型: 替换交叉摘要: 本文检查将自助监督去噪作为训练基于深度学习（DL）的重建方法的预处理步骤，以改善受高斯噪声污染的数据的效果。用于训练的K空间数据通常为多线圈并伴有固有的噪声。尽管在完全采样的数据上训练的基于DL的重建方法可以实现高质量的重建，但获取大规模、无噪声的数据集是不实际的。本文利用广义斯tein无偏风险估计（GSURE）进行去噪。本文评估了两种基于DL的重建方法：扩散概率模型（DPMs）和模型导向的深度学习（MoDL）。评估了去噪对这些基于DL的方法在解决加速的多线圈磁共振成像（MRI）重建中的性能影响。实验是在T2加权脑部扫描和脂肪抑制的质子密度膝部扫描上进行的。我们观察到，自助监督去噪可以提高各种情况下MRI重建的质量和效率。具体而言，将去噪图像而不是带噪图像用于训练DL网络时，在不同信噪比水平（包括T2加权脑部数据的32dB、22dB和12dB，脂肪抑制的膝部数据的24dB、14dB和4dB）下，可以获得较低的归一化均方根误差（NRMSE）、更高的结构相似性指数（SSIM）和峰值信噪比（PSNR）。总体而言，本文显示了去噪是一个重要的预处理技术，能够在各种条件下提高基于DL的MRI重建方法的效率。通过提高输入数据的质量，去噪使训练更有效的DL网络成为可能，并且可能绕过了需要无噪声参考MRI扫描的需求。

发布时间: 4/22/2025

查看原文

可在下游任务中证明的主题建模不可学习

作者: Stanley Wei, Sadhika Malladi, Sanjeev Arora, Amartya Sanyal

arXiv:2411.12600v3 宣布类型: 替换-交叉摘要：随着对训练数据来源的法律关注不断增加，机器忘记算法变得越来越重要，但验证忘记的成功往往很难。关于忘记的可验证保证通常仅限于监督学习环境。在本文中，我们首次为预训练和微调范式中的忘记提供理论保证，通过研究主题模型，即可以适应解决检索和分类等下游任务的简单的词袋语言模型。首先，我们设计了一个证明有效的主题模型忘记算法，其计算开销与其原始数据集的大小无关。我们的分析还量化了模型的删除容量——即可以在不显著影响模型性能的情况下删除的示例数量。最后，我们正式将我们的分析扩展以考虑模型对给定下游任务的适应。特别是，我们设计了一个高效算法，在通过线性头部微调主题模型后执行忘记。值得注意的是，我们展示了对于被特定任务微调的主题模型，删除预训练数据更容易，而且可以不修改基础模型就删除这些数据。

发布时间: 4/22/2025

查看原文

开放世界的深度主动学习

作者: Tian Xie, Jifan Zhang, Haoyue Bai, Robert Nowak

arXiv:2411.06353v2 Announce Type: replace-cross 摘要：部署在开放世界的机器学习模型通常会遇到不熟悉的条件，并在不可预见的情况下表现不佳。随着人工智能系统的发展并在关键安全领域找到应用，处理离分布（OOD）数据的有效性对于构建开放世界学习系统至关重要。在这项工作中，我们引入了ALOE，一种新颖的开放世界环境中的主动学习算法，旨在通过两阶段方法增强模型适应性，从而通过新OOD类增强模型。首先，多样性采样选择一组代表性示例，然后通过能量分布的OOD检测优先标记可能未知的类。这种策略可以在资源受限的注释预算下加速类的发现和学习。在三个长尾图像分类基准上的评估表明，ALOE优于传统的主动学习基准，能够在平衡注释成本的同时扩展已知类别。我们的研究结果揭示了增强已知类别性能与发现新类别之间的重要权衡，为未来的开放世界机器学习进步奠定了基础。

发布时间: 4/22/2025

查看原文

FactLens：细粒度事实验证基准测试

作者: Kushan Mitra, Dan Zhang, Sajjadur Rahman, Estevam Hruschka

arXiv:2411.05980v2 宣告类型: 交叉替换摘要：大型语言模型（LLMs）在语言生成和理解方面表现出令人印象深刻的能力强项，但它们倾向于产生虚构内容并生成事实错误信息，这是其一个关键限制。为了验证大型语言模型生成的内容和来自其他来源的声明，传统的验证方法往往依赖于整体模型，为复杂的声明分配一个单一的事实标签，这可能会掩盖细微的错误。在本文中，我们提倡转向精细化验证，即将复杂的声明拆分为较小的子声明，进行个别验证，从而能够更精确地识别不准确性，提高透明度，并减少证据检索中的模糊性。然而，生成子声明也带来了一些挑战，如保持上下文和在原声明方面确保语义等价。我们引入了FactLens，这是一个用于评估精细化事实验证的标准，包含评估子声明质量的指标和自动评估器。基准数据由人工精挑细选，以确保高质量的地面真值。我们的结果显示，自动FactLens评估器与人类判断之间存在一致，我们还讨论了子声明特征对整体验证性能的影响。

发布时间: 4/22/2025

查看原文

Aioli：统一的语言模型数据混合优化框架

作者: Mayee F. Chen, Michael Y. Hu, Nicholas Lourie, Kyunghyun Cho, Christopher R\'e

arXiv:2411.05735v2 宣告类型: 替换-交叉摘要：语言模型性能取决于识别出用于训练的最佳数据组混合比例（例如，法律、代码、数学）。先前的工作提出了多种高效学习混合比例的方法，从拟合训练运行的回归模型到在整个训练过程中动态更新比例。令人惊讶的是，我们发现现有方法在平均测试困惑度方面没有一种能一贯优于简单分层采样基准方法。为了理解这种不一致，我们将现有的方法统一到一个标准框架中，表明它们等效于解决一个共同的优化问题：在特定方法的混合法则约束下最小化平均损失——这是对损失与混合比例之间关系的显式假设。该框架表明，测量方法混合法则的保真度可以提供其性能的洞察。实验证明，现有方法设置其混合法则参数不准确，导致我们观察到的不一致的混合性能。利用这一洞见，我们推导出一种新的在线方法Aioli，该方法在整个训练过程中直接估计混合法则参数，并使用它们动态调整比例。Aioli在6个数据集中比分层采样高出平均0.27个测试困惑度点，而现有方法未能一贯地超越分层采样，在最坏情况下比分层采样差6.9个点。此外，在计算资源有限而导致比例需在较短训练运行中学习的实际场景中，Aioli可以动态调整这些比例，在整个训练过程中始终一致地将性能提升最高达12.012个测试困惑度点，超过现有方法。

发布时间: 4/22/2025

查看原文