arXiv 论文列表

作者: Tingyang Sun, Tuan Nguyen, Ting He

arXiv:2504.12210v1 宣布类型: cross 摘要：分布式联邦学习（DFL）是一种有前途的机器学习范式，可用于将人工智能（AI）能力带到网络边缘。然而，将DFL应用于边缘网络，由于代理之间广泛的参数交换，面临着严重的性能挑战。现有的大多数针对这些挑战的解决方案都基于简化的通信模型，这些模型无法捕捉多跳带宽受限网络上的学习情况。在这项工作中，我们通过联合设计由代理形成的覆盖网络的通信方案和控制代理之间通信需求的混叠矩阵，来解决这个问题。通过对问题的性质进行仔细分析，我们将每个设计问题转化为可处理的优化问题，并开发了一个具有性能保证的有效算法。基于真实拓扑和数据的评估显示，所提出的方法与基线相比，可以将总训练时间减少超过80%，同时在与现有技术相比时显著提高了计算效率，而不会牺牲准确性。

发布时间: 4/17/2025

查看原文

从需求到架构：半自动化生成软件架构

作者: Tobias Eisenreich

arXiv:2504.12192v1 公告类型：交叉摘要：为了支持初级和高级建筑师，我建议开发一种新的建筑创作方法，利用LLMs（大型语言模型）不断发展的能力来支持建筑师。该方法涉及建筑师在整个过程中与由LLM驱动的工具进行密切合作。建筑师将被引导进行领域模型创建、用例规范、架构决策以及架构评估。尽管建筑师可以完全控制整个过程及其结果，并将工具作为构建块使用，但他们也可以遵循预期的过程以获得最大的工具支持。初步结果表明了该过程的可行性，并表明了对建筑师而言可能的巨大时间节约。

发布时间: 4/17/2025

查看原文

大型语言模型知道什么？默会知识作为潜在的因果解释结构

作者: C\'eline Budding

arXiv:2504.12187v1 交叉类型公告摘要：有时假设大型语言模型（LLMs）懂得语言，或者例如它们知道巴黎是法国的首都。但是LLMs究竟知道什么呢？在这篇论文中，我论述了LLMs可以像马丁·戴维斯（1990年）所定义的那样获得默示知识。尽管戴维斯本人否认神经网络可以获取默示知识，但我证明了LLMs的某些架构特性满足语义描述、句法结构以及因果系统性的要求。因此，默示知识可以作为描述、解释和干预LLMs及其行为的 Conceptual框架。

发布时间: 4/17/2025

查看原文

SALAD：通过结构意识和大语言模型驱动的数据增强对比学习提高鲁棒性和泛化能力

作者: Suyoung Bae, Hyojun Kim, YunSeok Choi, Jee-Hyong Lee

arXiv:2504.12185v1 类型: cross 摘要: 在各种自然语言处理（NLP）任务中，微调预训练语言模型（PLMs）往往会导致假相关问题，这会负面影响模型性能，特别是在处理分布外部数据时。为了解决这个问题，我们提出了SALAD（Structure Aware and LLM-driven Augmented Data），一种通过生成结构感知和反事实增强数据以增强模型鲁棒性和泛化能力的新方法。我们的方法利用标记方法生成结构感知的正样本，并利用大型语言模型（LLMs）生成具有多种句子模式的反事实负样本。通过对比学习，SALAD使模型能够专注于学习关键句子组件之间的结构关系，同时减少对假相关性的依赖。我们通过在三种任务——情感分类、性别歧视检测和自然语言推理——上的实验验证了我们的方法。结果表明，SALAD不仅提高了模型在不同环境下的鲁棒性和性能，还增强了对分布外部数据集和跨域场景的泛化能力。

发布时间: 4/17/2025

查看原文

信任 CHATGPT：提示中的细微调整如何导致情感分类上的重大差异

作者: Jaime E. Cuellar, Oscar Moreno-Martinez, Paula Sofia Torres-Rodriguez, Jaime Andres Pavlich-Mariscal, Andres Felipe Mican-Castiblanco, Juan Guillermo Torres-Hurtado

arXiv:2504.12180v1 交叉类型公告摘要：当今社会科学的一个基本问题是：我们能信任像ChatGPT这样的高度复杂预测模型到什么程度？这项研究测试了这样一个假设：提示结构的微妙变化不会对大型语言模型GPT-4o mini生成的情感极性分类结果产生显著影响。研究人员使用了包含4位拉丁美洲总统的10万条西班牙语评论的数据集，在10次不同的测试中，每次略微改变提示，将评论分类为正面、负面或中性。实验方法包括探索性分析和验证性分析，以识别分类结果中的显著差异。结果表明，即使是词法、句法或语气变化，甚至是缺乏结构的变化，都会影响分类结果。在某些情况下，模型会产生不一致的反应，如混淆类别、提供不必要的解释或使用除西班牙语以外的语言。卡方检验的统计分析证实，在大多数比较中，提示之间存在显著差异，但在一个提示结构高度相似的情况下，未发现显著差异。这些发现挑战了大型语言模型在分类任务中的可靠性和可信度，强调了它们对指令变化的脆弱性。此外，明显缺乏结构化的语法提示会增加幻觉发生的频率。讨论强调了对大型语言模型的信任不仅依赖于技术性能，还依赖于它们使用的社会和制度背景下的关系。

发布时间: 4/17/2025

查看原文

使用人工智能映射争议：耶路撒冷-以色列冲突在YouTube上的分析

作者: Victor Manuel Hernandez Lopez, Jaime E. Cuellar

arXiv:2504.12177v1 交叉领域公告类型：跨领域摘要：本文通过分析2023年10月至2024年1月之间发布的253,925条西班牙语YouTube评论，探讨了哈马斯与以色列的争议，这是在10月7日冲突升级后进行的。研究采用跨学科的方法，结合科学技术研究（STS）中的争议分析与先进的计算方法，具体使用自然语言处理（NLP）中的BERT（变换器双向编码表示）模型。使用这种方法，评论被自动分类为七个类别，反映出亲巴勒斯坦、亲以色列、反巴勒斯坦等立场。结果表明，亲巴勒斯坦的评论占主导地位，尽管亲以色列和反巴勒斯坦的评论获得了更多的“赞”。此外，该研究还应用议程设置理论来展示媒体覆盖如何显著影响公众的看法，并观察到公众意见发生了显著的转变，从亲巴勒斯坦的观点转变为对以色列更加批判的态度。这项工作强调了在争议分析中结合社会科学视角和技术工具的重要性，并通过将计算分析与批判性社会理论相结合，提出了一种方法论创新，以应对复杂的社会舆论现象和媒体叙述。

发布时间: 4/17/2025

查看原文

阿拉伯诗歌音步分类：为低资源任务集成高资源系统

作者: Maged S. Al-Shaibani, Zaid Alyafeai, Irfan Ahmad

arXiv:2504.12172v1 宣告类型: cross 摘要: 阿拉伯诗歌是阿拉伯语言和文化中不可或缺且不可分割的一部分。阿拉伯人使用诗歌来突出他们的重要事件，如描写残酷的战斗和冲突。他们也像其他许多语言一样，使用诗歌用于多种目的，如浪漫、自豪、哀悼等。阿拉伯诗歌在几十年来受到了语言学的广泛关注。阿拉伯诗歌的一个主要特征是其特殊的节奏结构，不同于散文。这种结构被称为“韵律”。韵律连同其他诗歌特征，在一个名为“Aroud”的阿拉伯语言学领域中被深入研究。识别诗歌中的这些韵律是最长且复杂的过程之一。这也需要对“Aroud”技术知识的理解。对于朗诵诗歌而言，还需要额外的一层处理。为了自动识别朗诵阿拉伯诗歌的韵律，开发系统需要大量的标注数据。在本研究中，我们提出了一种最先进的框架来识别朗诵阿拉伯诗歌的韵律，其中我们整合了两个独立的高资源系统来执行低资源任务。为了确保我们提出的架构的一般性，我们为未来的研究发布了该任务的基准数据。

发布时间: 4/17/2025

查看原文

面向可解释融合与平衡学习的多模态情感分析

作者: Miaosen Luo, Yuncheng Jiang, Sijie Mai

arXiv:2504.12151v1 交叉公告类型摘要：多模态情感分析（MSA）面临两个关键挑战：多模态融合决策逻辑的不可解释性以及由于跨模态信息密度差异导致的模态不平衡。为了解决这些问题，我们提出了一种名为KAN-MCP的新框架，该框架将Kolmogorov-Arnold网络（KAN）的可解释性和Multimodal Clean Pareto（MCPareto）框架的鲁棒性相结合。首先，KAN利用其一元函数分解来实现跨模态交互的透明分析。这种结构设计允许直接检查特征变换，无需依赖外部解释工具，从而确保了高表达性和可解释性。其次，所提出的MCPareto通过解决模态不平衡和噪声干扰来增强鲁棒性。具体而言，我们引入了维度降低和去噪模态信息瓶颈（DRD-MIB）方法，该方法同时进行去噪和特征维度的降维。该方法为KAN提供具有辨别性的低维输入，以减少KAN的建模复杂性，同时保留关键的情感相关信息。此外，MCPareto通过DRD-MIB输出的净化特征动态平衡模态间梯度贡献，确保辅助信号的无损传输并对模态不平衡进行有效缓解。这种可解释性和鲁棒性的协同作用不仅在CMU-MOSI、CMU-MOSEI和CH-SIMS v2等基准数据集上实现了卓越的性能，还通过KAN的可解释结构提供了直观的可视化界面。

发布时间: 4/17/2025

查看原文

ARCeR: 一种用于自动化定义网络范围的有机关联检索

作者: Matteo Lupinacci, Francesco Blefari, Francesco Romeo, Francesco Aurelio Pironti, Angelo Furfaro

arXiv:2504.12143v1 攻击类型：跨领域摘要：不断发展的网络威胁景观迫切需要开发支持工具和平台，这些工具和平台能够在受控的虚拟环境中创建现实的IT环境，即网络靶场（Cyber Ranges, CRs）。CRs 可以被利用来分析漏洞，并实验所设计的防御措施的有效性，同时可以作为培养IT操作员的网络安保技能和能力的训练环境。本文提出 ARCeR 作为一种创新的解决方案，可以从用户提供的自然语言描述中自动生成和部署CRs。ARCeR 依赖于代理型RAG（Agentic RAG）范式，这使得它能够充分利用最先进的AI技术。实验结果表明，ARCeR 能够成功处理即使对于大型语言模型（LLMs）或基本的RAG系统也无法应对的提示。此外，只要向ARCeR 提供特定知识，它就能够针对任何提供的CR框架。

发布时间: 4/17/2025

查看原文

高效对比解码与概率幻觉检测 - 减轻大型视觉语言模型中的幻觉 -

作者: Laura Fieback, Nishilkumar Balar, Jakob Spiegelberg, Hanno Gottschalk

arXiv:2504.12137v1 Announce Type: cross 摘要：尽管近年来大型视觉语言模型（LVLMs）取得了进展，但这些模型仍然会产生与提供的视觉输入不符的幻觉响应。为缓解这种幻觉现象，我们引入了一种高效对比解码（ECD）方法，这是一种简单的利用概率幻觉检测方法，在推理时将输出分布转向语境准确的答案。通过对比词token的概率和幻觉分数，ECD从原始分布中减去了幻觉的概念，有效地抑制了幻觉。值得注意的是，我们提出的方法可以应用于任何开源LVLM，并且不需要额外的LVLM训练。我们在几个基准数据集和不同的LVLM上评估了该方法。我们的实验表明，ECD有效缓解了幻觉现象，在LVLM基准测试性能和计算时间方面超过了最先进的方法。

发布时间: 4/17/2025

查看原文