arXiv 论文列表

停止！使用敏感性测试对大型语言模型进行基准测试以评估其攻击性进展

arXiv:2409.13843v1 公告类型: 交叉摘要: 减轻大型语言模型(LLMs)中的显性和隐性偏见已成为自然语言处理领域的一个关键焦点。然而,许多当前的方法在评估场景时是孤立的,没有考虑到更广泛的背景或每个情境中潜在偏见的范围。为了解决这个问题,我们引入了针对冒犯性进展的敏感性测试(STOP)数据集,该数据集包含450个冒犯性进展,包含2700个独特句子,这些句子的严重程度逐渐升级,从不太明显到更明显地冒犯。涵盖了9个主要群体和46个子群体的广泛范围,STOP确保了包容性和全面覆盖。我们评估了几个领先的闭源和开源模型,包括GPT-4、Mixtral和Llama 3。我们的研究结果表明,即使是表现最好的模型在检测偏见方面也存在不一致性,成功率从19.3%到69.8%不等。我们还展示了如何使模型与STOP上的人类判断保持一致,从而将敏感任务(如BBQ、StereoSet和CrowS-Pairs)的模型回答率提高多达191%,同时保持或甚至提高性能。STOP提供了一个评估LLMs中偏见复杂性的新框架,这将有助于制定更有效的偏见缓解策略,并促进更公平的语言模型的创建。

发布时间: 9/24/2024

查看原文

通过部分信息探针测量大型语言模型的版权风险

探索用于训练大型语言模型（LLMs）的数据源是研究这些模型潜在版权侵权行为的关键方向。尽管这种方法可以识别训练数据中可能使用的受版权保护的材料，但它并不直接衡量侵权风险。最近的研究已转向测试LLMs是否能直接输出受版权保护的内容。针对这一方向，我们研究并评估了LLMs通过提供受版权保护材料的片段信息来生成侵权内容的能力，并尝试使用迭代提示来促使LLMs生成更多侵权内容。具体而言，我们将受版权保护文本的一部分输入LLMs，提示它们完成该文本，然后分析生成内容与原始受版权保护材料之间的重叠。我们的研究结果表明，基于这些部分输入，LLMs确实能够生成与受版权保护材料高度重叠的内容。

发布时间: 9/24/2024

查看原文

全自动AI语音钓鱼攻击的可行性研究

arXiv:2409.13793v1 公告类型: 交叉摘要: 语音钓鱼攻击是一种社会工程学形式，攻击者通过电话欺骗个人泄露敏感信息，如个人数据、财务信息或安全凭证。攻击者利用语音通信的紧迫感和真实性来操纵受害者，通常冒充银行或技术支持等合法实体。语音钓鱼是一个特别严重的威胁，因为它绕过了旨在保护信息的安全控制。在这项工作中，我们研究了随着人工智能的出现，语音钓鱼攻击升级的潜力。理论上，人工智能驱动的软件机器人可能有能力通过电话与潜在受害者进行对话并欺骗他们泄露敏感信息，从而自动化这些攻击。为了验证这一论点，我们引入了ViKing，一个使用公开可用的人工智能技术开发的AI驱动的语音钓鱼系统。它依赖于大型语言模型（LLM）作为其核心认知处理器，以引导与受害者的对话，并辅以语音到文本和文本到语音模块的管道，以促进电话中的音频文本转换。通过涉及240名参与者的受控社会实验，我们发现ViKing成功说服了许多参与者泄露敏感信息，甚至那些明确被告知语音钓鱼活动风险的参与者。与ViKing的机器人互动通常被认为是真实的。根据这些发现，我们得出结论，像ViKing这样的工具可能已经可以被潜在的恶意行为者访问，同时也为网络安全意识项目提供了宝贵的资源。

发布时间: 9/24/2024

查看原文

软抓取器多模态数据融合的持续学习

持续学习（CL）是指算法能够持续并逐步地从其环境中获取新知识，同时保留先前学习的信息的能力。在一个数据模态上训练的模型在测试不同模态时往往会失败。一种直接的方法可能是通过连接两种模态的特征并将模型训练在融合数据上来融合这两种模态。然而，这要求每次遇到新领域时都从头开始重新训练模型。本文介绍了一种持续学习算法，该算法能够在人工环境中逐步学习不同的数据模态，该环境中的标注数据稀缺，但来自环境的非独立同分布（iid）未标注数据丰富。所提出的算法高效，仅需要存储每个类的原型。我们在一个具有挑战性的自定义多模态数据集上评估了该算法的有效性，该数据集包括来自软气动夹具的触觉数据和从视频序列中提取的非静止图像的视觉数据。此外，我们在自定义数据集和Core50数据集上进行了消融研究，以突出算法不同组件的贡献。为了进一步展示算法的鲁棒性，我们使用软夹具和外部独立摄像头设置进行实时物体分类实验，所有设备均与机器人操作系统（ROS）框架同步。

发布时间: 9/24/2024

查看原文

基于机器学习的肝细胞癌早期诊断多组学数据整合

不同模态患者数据中的互补信息有助于更准确地建模患者的疾病状态，并更好地理解疾病的潜在生物学过程。然而，多模态、多组学数据的分析面临许多挑战，包括高维度、不同模态间大小、统计分布、尺度及信号强度的差异。本文比较了多种能够进行晚期整合的多类数据集成机器学习算法的性能。测试的集成方法及其变体包括：i) 投票集成，包括硬投票和软投票；ii) 元学习器；iii) 多模态Adaboost模型，使用硬投票、软投票和元学习器在每次提升回合中整合模态，PB-MVBoost模型以及专家混合模型的新应用。这些方法与简单的连接作为基线进行了比较。我们使用肝细胞癌（HCC）的内部研究数据以及乳腺癌和肠易激综合征（IBD）的四项验证研究数据来评估这些方法。通过接收者操作特征曲线下面积（AUC）作为性能指标，我们开发了性能值高达0.85的模型，并发现两种提升方法，即PB-MVBoost和软投票Adaboost，是整体表现最佳的模型。我们还考察了所选特征的稳定性以及确定的临床特征的大小。最后，我们为多模态多类数据的整合提供了建议。

发布时间: 9/24/2024

查看原文

重访合成人类轨迹：模仿生成与超越Datasaurus的基准测试

arXiv:2409.13790v1 公告类型: 交叉摘要: 人类轨迹数据在人群管理、疫情预防等诸多应用中起着至关重要的作用，但由于实际限制和隐私问题，获取这些数据具有挑战性。在此背景下，生成的人类轨迹数据被用来尽可能逼真地模拟现实世界中的人类轨迹，通常基于汇总统计和分布相似性。然而，这些相似性（即所谓的“数据恐龙”）过度简化了人类移动模式的复杂性，导致生成模型设计和生成轨迹基准中存在内在偏差。在此背景下，我们提出了MIRAGE，一种模仿人类决策过程的轨迹生成模型，该模型作为神经时间点过程，集成了探索和优先返回模型。它模仿人类在轨迹生成中的决策过程，而不是像传统方法那样拟合任何特定的统计分布，从而避免了“数据恐龙”问题。此外，我们还提出了一种超越“数据恐龙”的综合任务型评估协议，以系统地对轨迹生成模型在四个典型下游任务上进行基准测试，结合每项任务的多种技术和评估指标，全面评估生成轨迹的最终效用。我们对MIRAGE在三个真实世界用户轨迹数据集上进行了全面评估，并与大量基线进行了对比。结果显示，与最佳基线相比，MIRAGE生成的轨迹数据不仅在统计和分布相似性上实现了59.0-71.5%的提升，而且在任务型评估中也取得了10.9-33.4%的提升。

发布时间: 9/24/2024

查看原文

量子进化算法在TSP组合优化问题中的应用

arXiv:2409.13788v1 公告类型: 交叉摘要: 本文采用量子遗传算法（QGA）实现了一种解决旅行商问题（TSP）的新方法。我们将这种新方法与传统的经典遗传算法（CGA）进行了比较。TSP是组合优化中的一个经典挑战，目标是找到访问一系列城市并返回起点的最短路径。我们选择TSP来测试两种算法的性能，因为它在计算复杂性和实际应用中的重要性。我们选择了国际标准库TSPLIB中的数据集进行实验。通过设计和实现两种算法，并在不同规模和类型的TSP实例上进行实验，我们深入分析了最优解的准确性、迭代次数、执行时间以及算法的稳定性。实证结果表明，在大多数测试实例中，尤其是在问题规模较大时，CGA在快速找到更优解方面优于QGA。这表明，尽管量子计算原理为解决复杂的组合优化问题提供了新途径，但量子现象的实现和参数设置（如量子旋转门的最佳角度）仍具有挑战性，需要进一步优化以达到预期效果。此外，值得注意的是，QGA尚未在实际量子硬件上进行测试，因此其真实性能尚未得到验证。这些局限性为未来的研究提供了丰富的机会。

发布时间: 9/24/2024

查看原文

通过多源元学习实现文本分类的未见领域泛化学习

随着深度学习方法的快速发展，文本分类领域取得了许多突破。针对这一任务开发的模型已显示出高准确率。然而，大多数这些模型都是使用来自已知领域的标记数据进行训练的。这些模型在新颖且具有挑战性的未知领域中难以保持高准确率，这直接关系到模型的泛化能力。本文研究了文本分类的多源领域泛化问题，并提出了一种利用多个已知领域训练模型以在未知领域中实现高准确率的框架。具体而言，我们提出了一种多源元学习领域泛化框架，以模拟模型对未知领域的泛化过程，从而提取足够的领域相关特征。我们引入了一种记忆机制来存储领域特定特征，并与元学习框架协同工作。此外，我们采用了新颖的“陪审团”机制，使模型能够学习足够的领域不变特征。实验表明，我们的元学习框架能够有效增强模型对未知领域的泛化能力，并在多源文本分类数据集上优于最先进的方法。

发布时间: 9/24/2024

查看原文

基于价值的多智能体协同决策并行更新蒙特卡洛树搜索方法

arXiv:2409.13783v1 公告类型: 交叉摘要: 为解决网联自动驾驶车辆（CAVs）的多车协同驾驶中的横向与纵向联合决策问题，本文提出了一种基于有限视野和时间折扣设置的多智能体马尔可夫博弈的蒙特卡洛树搜索（MCTS）方法，并采用并行更新策略。通过分析部分稳态交通流中多车联合行动空间中的并行动作，并行更新方法能够快速排除潜在的危险动作，从而在不牺牲搜索广度的情况下增加搜索深度。该方法在大量随机生成的交通流中进行了测试。实验结果表明，该算法具有良好的鲁棒性，并且在性能上优于现有的强化学习算法和启发式方法。采用该算法生成的车辆驾驶策略表现出超越人类驾驶员的合理性，并在协调区域内的交通效率和安全性方面具有优势。

发布时间: 9/24/2024

查看原文

AutoPET III挑战赛：利用ResEnc模型集成进行肿瘤病变分割

正电子发射断层扫描（PET）/计算机断层扫描（CT）在诊断、管理和规划各种癌症的治疗中至关重要。在多示踪剂多中心环境中开发可靠的深度学习模型用于PET/CT扫描中的肿瘤病变分割，是一个关键的研究领域。不同的示踪剂，如氟脱氧葡萄糖（FDG）和前列腺特异性膜抗原（PSMA），具有不同的生理摄取模式，不同中心的数据在采集协议、扫描仪类型和患者群体方面往往存在差异。由于这种变异性，设计可靠的分割算法和泛化技术变得更加困难，因为图像质量和病变可检测性存在差异。为了应对这一挑战，我们在no new U-Net框架内训练了一个3D残差编码器U-Net，旨在跨不同示踪剂和临床站点泛化全身PET/CT扫描的自动病变分割性能。此外，我们探索了几种预处理技术，并最终决定使用Total Segmentator来裁剪我们的训练数据。此外，我们在这一过程中应用了重采样。在推理过程中，我们利用测试时增强和其他后处理技术来增强肿瘤病变分割。我们的团队目前在Auto-PET III挑战中排名第一，并在初步测试集中以0.9627的Dice分数超越了挑战基线模型。

发布时间: 9/24/2024

查看原文