arXiv 论文列表

作者: Guangkun Nie, Gongzheng Tang, Shenda Hong

现实世界中数据分布不均衡的现象普遍存在，这对不均衡分类和不均衡回归任务都带来了巨大的挑战。这种不平衡往往导致深度学习模型在样本密度高（多样本区域）的区域过拟合，而在样本密度低（少样本区域）的区域表现不佳。这一特性限制了深度学习模型在各个领域的应用，尤其是在医疗保健领域，少样本数据区域具有更大的临床意义。虽然最近的研究表明在不均衡分类任务中结合分布信息的好处，但这种策略在不均衡回归中很少被探索。在本文中，我们通过引入一种新颖的损失函数Dist Loss来解决这个问题，该函数旨在以可微分的方式最小化模型预测与目标标签之间的分布距离，有效地将分布信息整合到模型训练中。Dist Loss使深度学习模型能够在训练过程中规范其输出分布，有效地增强其对少样本区域的关注。我们在涵盖计算机视觉和医疗保健的三个数据集（IMDB-WIKI-DIR、AgeDB-DIR和ECG-Ka-DIR）上进行了大量的实验。结果表明，Dist Loss有效地减轻了数据分布不均衡对模型性能的负面影响，在稀疏数据区域取得了最先进的结果。此外，Dist Loss易于集成，可以补充现有方法。

发布时间: 11/26/2024

查看原文

S$^2$ALM：用于全面抗体表征学习的序列-结构预训练大型语言模型

作者: Mingze Yin, Hanjing Zhou, Jialu Wu, Yiheng Zhu, Yuxuan Zhan, Zitai Kong, Hongxia Xu, Chang-Yu Hsieh, Jintai Chen, Tingjun Hou, Jian Wu

抗体通过其对特定抗原的精确和有效结合来保护我们的健康，在包括COVID-19在内的多种疾病的治疗中显示出良好的治疗效果。生物医学语言模型的最新进展表明了其在解释复杂的生物结构和功能方面的巨大潜力。然而，现有的抗体特异性模型存在一个显著的局限性，即它们缺乏对抗体结构信息的明确考虑，尽管一维序列和三维结构都包含对抗体行为和功能的独特且互补的见解。本文提出了一种序列-结构多层次预训练抗体语言模型（S$^2$ALM），将整体序列和结构信息结合在一个统一的通用抗体基础模型中。我们构建了一个分层预训练范式，并结合了两个定制的多层次训练目标，以促进全面抗体表征的建模。S$^2$ALM的表示空间揭示了内在的功能结合机制、生物进化特性和结构相互作用模式。S$^2$ALM预训练了超过7500万个序列和1170万个结构，可用于各种下游任务：准确预测抗原-抗体结合亲和力，精确区分B细胞成熟阶段，识别抗体关键结合位点，以及特异性设计新型冠状病毒结合抗体。值得注意的是，S$^2$ALM优于已建立的著名基线，并在广泛的抗体特异性理解和生成任务中取得了最先进的性能。S$^2$ALM建模全面和通用表征的能力，进一步提升了其在推进现实世界治疗性抗体开发方面的潜力，可能满足未满足的学术、工业和临床需求。

发布时间: 11/26/2024

查看原文

基于服务特定移动流量数据的城市区域嵌入

作者: Giulio Loddi, Chiara Pugliese, Francesco Lettich, Fabio Pinelli, Chiara Renso

随着先进4G/5G移动网络的出现，运营商收集的手机数据现在包含具有高时空分辨率的详细的、特定服务的流量信息。本文利用此类数据来探索其生成高质量城市区域表示的潜力。为此，我们提出了一种从特定服务的移动流量数据创建城市区域嵌入的方法，该方法采用基于时间卷积网络的自编码器、Transformer和可学习加权求和模型来捕捉关键的城市特征。在使用真实世界数据集进行的大量实验评估中，我们证明了我们的方法生成的嵌入有效地捕捉了城市特征。具体来说，我们将我们的嵌入与最先进的竞争对手的嵌入在两个下游任务中进行了比较。此外，通过聚类技术，我们研究了我们的方法产生的嵌入如何更好地捕捉底层城市区域的时间动态和特征。总的来说，这项工作突出了特定服务的移动流量数据在城市研究中的潜力，并强调了使此类数据易于访问以支持公共创新的重要性。

发布时间: 11/26/2024

查看原文

基于关系图神经网络和强化学习的有效模拟集成电路布局规划

作者: Davide Basso, Luca Bortolussi, Mirjana Videnovic-Misic, Husni Habal

模拟集成电路(IC)的布局规划通常是一个手动过程，元件（器件和模块）的放置由布局工程师规划。这个过程由于布局规划和布线步骤的相互依赖、众多电气和布局相关的约束以及模拟设计中预期的高度定制化而变得更加复杂。本文提出了一种基于强化学习的新型自动布局规划算法。它通过关系图卷积神经网络模型来编码电路特征和位置约束。这两种机器学习方法的结合能够在具有不同拓扑结构和约束的各种电路设计之间进行知识迁移，从而提高解决方案的泛化能力。应用于6个工业电路，我们的方法在速度、面积和半周长布线长度方面超越了已有的布局规划技术。当集成到布局完成的程序生成器中时，与手动布局相比，总布局时间减少了67.3%，平均面积减少了8.3%。

发布时间: 11/26/2024

查看原文

轻量级大型语言模型LightLLM：用于预测光传感的通用模型

作者: Jiawei Hu, Hong Jia, Mahbub Hassan, Lina Yao, Brano Kusy, Wen Hu

我们提出了一种名为LightLLM的模型，该模型对预训练的大型语言模型 (LLM) 进行微调，用于基于光线的传感任务。它集成了传感器数据编码器以提取关键特征，上下文提示以提供环境信息，以及融合层以将这些输入组合成统一的表示。然后，预训练的LLM处理此组合输入，在微调过程中，通过添加轻量级的可训练组件来进行微调，同时保持其原始参数不变，从而使模型能够适应新的任务而无需更改其原始参数。这种方法能够以最小的计算开销和再训练工作量，灵活地将LLM应用于专门的光传感任务。我们已经为三个光传感任务实现了LightLLM：基于光线的定位、室外太阳能预测和室内太阳能估算。使用真实世界的实验数据集，我们证明LightLLM显著优于最先进的方法，在以前未见的环境中测试时，定位精度提高了4.4倍，室内太阳能估算精度提高了3.4倍。我们进一步证明，LightLLM优于直接提示的ChatGPT-4，突出了LightLLM专门用于传感器数据与文本提示融合的架构的优势。

发布时间: 11/26/2024

查看原文

基于更强个体攻击的大规模对抗鲁棒性评估

作者: Yong Xie, Weijie Zheng, Hanxun Huang, Guangnan Ye, Xingjun Ma

随着深度学习模型越来越多地应用于安全关键型应用，评估其对抗性扰动漏洞对于确保其可靠性和可信度至关重要。在过去十年中，已经提出了大量的白盒对抗鲁棒性评估方法（即攻击方法），从单步到多步方法，从单个方法到集成方法。尽管取得了这些进展，但在进行有意义且全面的鲁棒性评估方面仍然存在挑战，尤其是在进行大规模测试和确保评估反映现实世界对抗风险方面。在这项工作中，我们关注图像分类模型，并提出一种新的个体攻击方法，概率裕度攻击（PMA），它在概率空间而不是 logits 空间中定义对抗裕度。我们分析了 PMA 与现有的交叉熵或 logits 裕度攻击之间的关系，并表明 PMA 可以优于当前最先进的个体方法。基于 PMA，我们提出了两种类型的集成攻击方法，以平衡有效性和效率。此外，我们创建了一个百万级数据集 CC1M，它源自现有的 CC3M 数据集，并用它对对抗训练的 ImageNet 模型进行了首次百万级白盒对抗鲁棒性评估。我们的研究结果为了解个体攻击与集成攻击以及小规模评估与百万级评估之间的鲁棒性差距提供了宝贵的见解。

发布时间: 11/26/2024

查看原文

M2oE：多模态协作专家肽模型

作者: Zengzhu Guo, Zhiqi Ma

肽是构成我们身体的重要生物分子，由氨基酸组成。近年来，肽在药物设计和合成中受到广泛关注，而肽预测任务有助于我们更好地寻找功能性肽。通常，我们使用肽的一级序列和结构信息进行模型编码。然而，最近的研究更侧重于单模态信息（结构或序列）的预测，而没有采用多模态方法。我们发现，单模态模型不擅长处理在特定模态中信息较少的的数据集。因此，本文提出了M2oE多模态协同专家肽模型。在先前工作的基础上，通过整合序列和空间结构信息，采用专家模型和交叉注意力机制，平衡并提高了模型的能力。实验结果表明，M2oE模型在复杂任务预测中表现优异。

发布时间: 11/26/2024

查看原文

Uni-Mlip：用于医学视觉语言预训练的统一自监督方法

作者: Ameera Bawazir, Kebin Wu, Wenbin Li

基于对比学习的视觉-语言预训练的最新进展显著提高了计算机视觉任务的性能。然而，在医学领域，由于隐私、敏感性和标注复杂性等原因，获取多模态数据往往成本高昂且充满挑战。为了在提高模型性能的同时减轻数据稀缺问题，我们引入了**Uni-Mlip**，这是一个统一的自监督框架，专门用于增强医学视觉-语言预训练。Uni-Mlip在数据层面和特征层面无缝集成了跨模态、单模态和融合模态的自监督技术。此外，Uni-Mlip还定制了单模态图像自监督技术，以适应医学图像的独特特性。我们在不同规模的数据集上的实验表明，Uni-Mlip在三个关键的下游任务中显著超越了当前最先进的方法：图像-文本检索、图像分类和视觉问答 (VQA)。

发布时间: 11/26/2024

查看原文

图上自监督条件分布学习

作者: Jie Chen, Hua Mao, Yuanbiao Gou, Zhu Wang, Xi Peng

图对比学习 (GCL) 在半监督图分类中展现出良好的性能。然而，现有研究仍然面临着 GCL 的重大挑战。首先，图神经网络 (GNN) 中的连续层倾向于产生更相似的节点嵌入，而 GCL 旨在增加负节点嵌入对之间的差异性。这不可避免地导致了 GNN 的消息传递机制与通过内部视图进行负样本对对比学习之间的冲突。其次，在利用图结构数据增强提供的多样性和数量的同时，保留内在语义信息具有挑战性。在本文中，我们提出了一种自监督条件分布学习 (SSCDL) 方法，旨在从图结构数据中学习图表示，用于半监督图分类。具体来说，我们提出了一种端到端的图表示学习模型，以对原始特征上弱增强特征和强增强特征的条件分布进行对齐。这种对齐有效地降低了通过图结构数据增强破坏内在语义信息的风险。为了避免消息传递机制与负样本对对比学习之间的冲突，保留了节点表示的正样本对，用于测量原始特征与其对应的弱增强特征之间的相似性。对多个基准图数据集进行的大量实验表明了所提出的 SSCDL 方法的有效性。

发布时间: 11/26/2024

查看原文

测试时自适应的标签分布偏移感知预测细化

作者: Minguk Jang, Hye Won Chung

测试时自适应 (TTA) 是一种有效的策略，用于减轻训练模型在测试时遇到输入分布偏移时出现的性能下降问题。然而，现有的 TTA 方法在面临额外类别分布偏移时，往往会遭受严重的性能下降。我们首先分析了标签分布偏移下的 TTA 方法，并确定了在不同协变量偏移中普遍存在的类别混淆模式。基于这一观察，我们引入了一种新的 TTA 方法——用于测试时自适应的标签分布偏移感知预测细化 (DART)，该方法通过关注类别混淆模式来细化预测结果。DART 在中间阶段通过使用训练数据集将其暴露于具有不同类别分布的多个批次来训练预测细化模块。然后，该模块在测试时用于检测和纠正类别分布偏移，显著提高测试数据的伪标签精度。我们的方法在 CIFAR-10C 上的标签分布偏移情况下，精度提高了 5% 到 18%，并且在没有标签分布偏移的情况下，性能不会下降。在 CIFAR、PACS、OfficeHome 和 ImageNet 基准测试上的大量实验表明，DART 能够纠正由测试时分布偏移引起的不准确预测。这种改进导致现有 TTA 方法的性能增强，使 DART 成为一个有价值的插件工具。

发布时间: 11/26/2024

查看原文