arXiv 论文列表

作者: Manuele Leonelli

贝叶斯网络 (BN) 被广泛用于对具有不确定性的复杂系统进行建模，但预先构建的 BN 库仍然有限。本文介绍了 bnRep，这是一个开源的 R 包，提供了一套完整的已记录 BN，方便基准测试、可重复性和教育。bnRep 包含了来自学术出版物的 200 多个网络，与 bnlearn 和其他 R 包无缝集成，为用户提供交互式工具来探索网络。

发布时间: 10/1/2024

查看原文

意图感知策略图：解答不透明代理中的“什么”、“如何”和“为什么”

作者: Victor Gimenez-Abalos, Sergio Alvarez-Napagao, Adrian Tormos, Ulises Cort\'es, Javier V\'azquez-Salceda

智能体是一种特殊的基于人工智能的软件，它们在复杂的环境中交互，并具有更大的涌现行为潜力。解释这种涌现行为是部署可信赖 AI 的关键，但许多智能体实现的日益复杂和不透明性使得这变得困难。在这项工作中，我们提出了一种概率图模型以及设计这种模型的流程——通过该模型可以对智能体的行为进行推演——并计算智能体在任何时刻的意图的鲁棒数值。我们贡献了评估所提供解释的可解释性和可靠性的度量，并使解释性问题成为可能，例如“你现在想做什么？”（例如，送汤）“你打算如何做？”（例如，返回一个考虑其技能和世界的计划）以及“为什么你会在这种状态下采取这种行动？”（例如，解释该行动如何促进或阻碍其自身目标）。该模型可以通过对智能体行动和世界状态的部分观察来构建，我们提供了一个迭代工作流程，通过更好的设计和/或指出非理性智能体行为来提高所提出的度量。

发布时间: 10/1/2024

查看原文

揭示置信区间：医疗影像人工智能是否已准备好应用于现实世界？

作者: Evangelia Christodoulou, Annika Reinke, Rola Houhou, Piotr Kalinowski, Selen Erkan, Carole H. Sudre, Ninon Burgos, Sofi\`ene Boutaj, Sophie Loizillon, Ma\"elys Solal, Nicola Rieke, Veronika Cheplygina, Michela Antonelli, Leon D. Mayer, Minu D. Tizabi, M. Jorge Cardoso, Amber Simpson, Paul F. J\"ager, Annette Kopp-Schneider, Ga\"el Varoquaux, Olivier Colliot, Lena Maier-Hein

医学影像正在引领人工智能在医疗领域的变革。性能报告是确定哪些方法应该转化为临床实践的关键。通常，广泛的结论仅仅源于平均性能值。在本文中，我们认为这种常见的做法通常是一个误导性的简化，因为它忽略了性能的可变性。我们的贡献有三方面。(1) 分析了 2023 年发表的所有 MICCAI 分割论文 (n = 221)，我们首先观察到超过 50% 的论文根本没有评估性能的可变性。此外，只有一篇 (0.5%) 论文报告了模型性能的置信区间 (CI)。(2) 为了解决报告瓶颈，我们表明分割论文中未报告的标准差 (SD) 可以通过平均 Dice 相似系数 (DSC) 的二阶多项式函数来近似。基于来自 56 个先前 MICCAI 挑战的外部验证数据，我们证明了这种近似可以利用出版物中提供的信息准确地重建方法的 CI。(3) 最后，我们重建了 MICCAI 2023 分割论文平均 DSC 周围的 95% CI。中位 CI 宽度为 0.03，是排名第一和排名第二方法之间中位性能差距的三倍。对于超过 60% 的论文，排名第二的方法的平均性能在排名第一的方法的 CI 内。我们得出结论，目前的出版物通常没有提供足够的证据来支持哪些模型有可能被转化为临床实践。

发布时间: 9/30/2024

查看原文

MoJE：混合型越狱专家，以朴素表格分类器作为提示攻击的防护

作者: Giandomenico Cornacchia, Giulio Zizzo, Kieran Fraser, Muhammad Zaid Hamed, Ambrish Rawat, Mark Purcell

大型语言模型 (LLM) 在各种应用中的普及突出了对强大安全措施的迫切需求，以阻止潜在的越狱攻击。这些攻击利用 LLM 中的漏洞，危及数据完整性和用户隐私。护栏作为抵御此类威胁的关键保护机制，但现有模型在检测准确性和计算效率方面往往不足。本文主张在 LLM 上预防越狱攻击的重要性，并强调输入护栏在保护这些模型中的作用。我们引入了 MoJE（越狱专家混合模型），这是一种新型的护栏架构，旨在超越现有最先进护栏的局限性。通过采用简单的语言统计技术，MoJE 在检测越狱攻击方面表现出色，同时在模型推理过程中保持最小的计算开销。通过严格的实验，MoJE 表明了其优越的性能，能够检测到 90% 的攻击，而不会影响良性提示，从而增强 LLM 抵御越狱攻击的安全性。

发布时间: 9/30/2024

查看原文

调制干预偏好优化 (MIPO): 保持简单，优化难点

作者: Cheolhun Jang

偏好优化方法通常以一个经过良好训练的 SFT 模型作为参考模型开始训练。在 RLHF 和 DPO 中，在偏好优化过程中使用正则化项来防止策略模型偏离参考模型的分布过远，从而避免生成异常响应。当参考模型已经与给定数据良好对齐或只需要进行微调时，这种方法可以产生一个良好对齐的模型。然而，如果参考模型没有与给定数据对齐，并且需要从其当前状态进行显著偏差，则正则化项实际上可能会阻碍模型对齐。在本研究中，我们提出了 **调制干预偏好优化 (MIPO)** 来解决这个问题。MIPO 根据给定数据与参考模型的对齐程度来调节参考模型的干预程度。如果数据对齐良好，则增加干预以防止策略模型与参考模型显著偏离。相反，如果对齐不良，则减少干预以促进更广泛的训练。我们使用 Mistral-7B 和 Llama3-8B 在 Alpaca Eval 2.0 和 MT-Bench 中比较了 MIPO 和 DPO 的性能。实验结果表明，MIPO 在各种评估场景中始终优于 DPO。

发布时间: 9/30/2024

查看原文

复数：一种通过模拟社会群体引导大型语言模型的系统

作者: Joshua Ashkinaze, Emily Fry, Narendra Edara, Eric Gilbert, Ceren Budak

近年来，关于语言模型可能偏向某些观点的争论引发了担忧。但如果解决方案不是追求“无处不在的观点”，而是利用不同的观点呢？我们介绍了 Plurals，一个用于多元化 AI 协商的系统和 Python 库。Plurals 由代理（LLM，可选地带有角色）组成，它们在可定制的结构中进行协商，由主持人监督协商。Plurals 是模拟社会群体的生成器。Plurals 整合了政府数据集以创建具有全国代表性的角色，包括受民主协商理论启发的协商模板，并允许用户自定义结构中的信息共享结构和协商行为。六个案例研究证明了对理论结构的保真度和有效性。三个随机实验表明，模拟焦点小组产生的输出与相关受众的在线样本产生共鸣（在 75% 的试验中选择胜过零样本生成）。Plurals 既是一种范式，也是一种具体的多元化 AI 系统。Plurals 库可在 https://github.com/josh-ashkinaze/plurals 获取，并将不断更新。

发布时间: 9/30/2024

查看原文

基于多视角伪标签的半监督语音认知状态分类

作者: Yuanchao Li, Zixing Zhang, Jing Han, Peter Bell, Catherine Lai

缺乏标注数据是语音分类任务中常见的挑战，尤其是那些需要大量主观评估的任务，例如认知状态分类。在这项工作中，我们提出了一种半监督学习（SSL）框架，引入了一种新颖的多视图伪标签方法，该方法利用声学和语言特征来选择最可靠的数据来训练分类模型。在声学方面，使用多个音频编码器生成的嵌入计算出的弗雷谢音频距离来比较未标注数据和标注数据。在语言方面，大型语言模型被提示修改自动语音识别转录并根据我们提出的任务特定知识预测标签。当来自这两个来源的伪标签一致时，就会识别出高置信度数据，而当不一致时，则被视为低置信度数据。然后训练一个双峰分类器，对低置信度数据进行迭代标记，直到满足预定义的标准。我们在情绪识别和痴呆症检测任务上评估了我们的 SSL 框架。实验结果表明，我们的方法在仅使用 30% 的标注数据的情况下，与完全监督学习相比，取得了具有竞争力的性能，并且明显优于两个选定的基线。

发布时间: 9/30/2024

查看原文

NovelAI Diffusion V3 中对 SDXL 的改进

作者: Juan Ossa, Eren Do\u{g}an, Alex Birch, F. Johnson

本技术报告记录了我们在训练 NovelAI Diffusion V3（我们最先进的动漫图像生成模型）过程中对 SDXL 所做的更改。

发布时间: 9/30/2024

查看原文

大型语言模型中的奖励鲁棒性强化学习自监督训练

作者: Yuzi Yan, Xingzhou Lou, Jialian Li, Yiping Zhang, Jian Xie, Chao Yu, Yu Wang, Dong Yan, Yuan Shen

随着大型语言模型（LLMs）不断朝着更高级的智能形式发展，来自人类反馈的强化学习（RLHF）越来越被视为实现通用人工智能（AGI）的关键途径。然而，对基于奖励模型（RM）的对齐方法的依赖带来了重大挑战，因为奖励模型（RM）固有的不稳定性和缺陷会导致奖励黑客攻击和与人类意图不一致等关键问题。在本文中，我们介绍了一种奖励鲁棒的 RLHF 框架，旨在解决这些基本挑战，为 LLMs 中更可靠、更具弹性的学习铺平道路。我们的方法引入了一种新颖的优化目标，通过结合贝叶斯奖励模型集合（BRME）来建模奖励函数的不确定性集，从而仔细平衡性能和鲁棒性。这使该框架能够整合名义性能和最小奖励信号，即使在不完美的 RM 中也能确保更稳定的学习。实证结果表明，我们的框架在各种基准测试中始终优于基线，显示出更高的准确性和长期稳定性。我们还提供了理论分析，证明奖励鲁棒的 RLHF 接近恒定奖励设置的稳定性，这在随机情况分析中也被证明是可以接受的。这些贡献共同突出了该框架在增强 LLM 对齐的性能和稳定性方面的潜力。

发布时间: 9/30/2024

查看原文

稀疏低秩自注意力Transformer用于光纤放大器剩余使用寿命预测

作者: Dominic Schneider, Lutz Rapp

光纤放大器是当前光网络的关键元件。这些组件的故障会导致网络运营商收入的巨大经济损失，因为受影响链路的通信流量将被中断。在预测性维护 (PdM) 的背景下，将剩余使用寿命 (RUL) 预测应用于光纤放大器，以便在早期阶段预测即将发生的系统故障，从而通过规划有针对性的维护措施来最大程度地减少网络中断，确保可靠性和安全性。光纤放大器是复杂的系统，在各种运行条件下工作，这使得准确预测成为一项艰巨的任务。系统监控能力的增强导致数据集的产生，这些数据集促进了数据驱动 RUL 预测方法的应用。特别是深度学习模型表现出了良好的性能，但基于 RUL 预测的相对较小的数据集进行泛化比较困难。在本文中，我们提出了一种名为稀疏低秩自注意力 Transformer (SLAT) 的新型 RUL 预测方法。SLAT 基于编码器-解码器架构，其中两个并行工作的编码器提取传感器和时间步长的特征。通过利用自注意力机制，可以从长序列中学习长期依赖关系。注意力矩阵中稀疏性的实现和低秩参数化减少了过拟合并提高了泛化能力。在 EDFA 上对光纤放大器进行的实验应用，以及来自涡轮风扇发动机的参考数据集表明，SLAT 优于最先进的方法。

发布时间: 9/30/2024

查看原文