arXiv:2501.06370v2 宣布类型: 修改交叉引用
摘要:确保大型语言模型(LLM)驱动系统的可靠性和可验证性仍然是软件工程中的一个重要挑战。我们提出了一种概率框架,通过建模和细化语义等效输出的簇分布,系统地分析和改进这些系统。该框架促进了对Transference Models的评估和迭代改进,这些模型利用LLM将输入转换为下游任务所需的输出。为了证明其适用性,我们将该框架应用于自然语言文档自形式化问题,即将自然语言文档转换为正式的程序规范。我们的案例研究说明了基于分布的分析如何识别弱点并指导集中化对齐改进,从而产生更可靠和可解释的输出。这种原则性的方法为应对鲁棒的LLM驱动系统开发中的关键挑战提供了基础。
arXiv:2501.06089v2 宣布类型: 替换-交叉
摘要:自动驾驶车辆(AVs)有望通过提升道路安全、交通效率和整体流动性来彻底改变交通运输。尽管近年来高级自动驾驶车辆取得了稳步进展,但转向完全自动化将经历一段混合交通期,在此期间不同自动化水平的AVs将与由人类驾驶的车辆(HDVs)共存。使AVs具有社会合规性并被人类驾驶员理解预计将提高混合交通的安全性和效率。因此,确保AVs与HDVs兼容并获得社会接受对于其成功和无缝整合到混合交通环境至关重要。然而,在这一关键领域,即开发社会合规自动驾驶车辆(SCAVs)的研究仍相对匮乏。这项研究首次进行了全面的范围审查,以评估当前SCAVs的发展状态,识别关键概念、方法论方法和研究缺口。还进行了非正式的专家访谈,以讨论范围审查结果并确定关键研究缺口和对SCAVs的期望。基于范围审查和专家访谈的输入,提出了一个概念框架,用于开发SCAVs。该概念框架使用在线调查进行了评估,该调查针对全球的研究人员、技术人员、政策制定者和其他相关专业人士。调查结果提供了宝贵的支持和洞见,证实了所提议的概念框架在应对将AVs整合到混合交通环境中所面临的挑战方面的必要性。此外,讨论了未来的研究方向和建议,有助于SCAVs的研究与发展议程。
arXiv:2501.06019v2 宣告类型: replace-cross
摘要:全球各地都会发生灾害事件,这些事件对人类生命和财产造成了重大破坏。地球观测(EO)数据使得能够迅速且全面地评估建筑物损坏情况(BDA),这是灾害发生后减少人员伤亡并指导灾害救援努力的重要能力。最近的研究主要集中在开发AI模型以准确映射未见过的灾害事件,多数使用光学EO数据。然而,基于光学数据的解决方案仅限于晴朗的天空和白天时间,无法迅速应对灾害。通过整合多模态(MM)EO数据,尤其是结合光学和SAR图像,提供了全天候、日以继夜的灾害响应可能性。尽管存在这种潜力,但开发健壮的多模态AI模型受限于缺乏合适的基准数据集。在本文中,我们提出了使用非常高分辨率光学和SAR图像进行BDA的数据集(BRIGHT),以支持基于AI的全天候灾害响应。据我们所知,BRIGHT是第一个开放访问、全球分布、事件多样化的多模态数据集,专门用于支持基于AI的灾害响应。该数据集涵盖了五种自然灾害和两种人为灾害,时间跨度横跨世界14个地区,特别关注最需要外部援助的发展中国家。BRIGHT中的光学和SAR图像,具有0.3-1米的分辨率,提供了详细的单个建筑物表示,使其非常适合精确的BDA。在我们的实验中,我们测试了使用BRIGHT训练的七个先进AI模型,以验证其可迁移性和鲁棒性。数据集和代码可在https://github.com/ChenHongruixuan/BRIGHT获取。BRIGHT还将作为2025 IEEE GRSS数据融合竞赛的官方数据集。
arXiv:2501.02406v3 宣告类型:替换-交叉
摘要:验证内容的来源对于许多组织的功能至关重要,例如教育机构、社交媒体平台、公司等。随着由大型语言模型(LLMs)生成的文本几乎无法与人类生成的内容区分开来,这一问题变得日益具有挑战性。此外,许多机构使用内部的LLMs,并且希望确保外部未经许可的LLMs不会在该机构中生成内容。我们回答了以下问题:给定一段文本,我们能否识别它是由LLM A还是LLM B(其中B可以是人类)生成的?我们将LLM生成的文本视为完全依赖于历史的序贯随机过程,并设计零样本统计测试来区分(i)由不同两组LLM A(内部的)和B(未经许可的)生成的文本,以及(ii)LLM生成的文本和人类生成的文本。我们证明了我们的测试的第一类和第二类错误随着文本长度的增加呈指数级减少。在为给定字符串设计我们的测试时,我们演示了如果字符串是由评估模型A生成的,那么在字符串长度下该字符串在A下的对数困惑度将收敛于该字符串在A下的平均熵,概率偏差为字符串长度的指数级小。我们还展示了如果B生成了文本,在字符串长度下该字符串在A下的对数困惑度将收敛于B和A的平均交叉熵,概率偏差为字符串长度的指数级小。在我们的实验中:首先,我们使用开源的LLMs进行实验以支持我们的理论结果,然后在对抗攻击的情况下提供了黑盒设置中的实验。实际上,我们的工作使确定有害或虚假LLM生成文本的来源成为可能,这有助于打击误导性信息并符合新兴AI法规。
arXiv:2501.00016v2 宣告类型:替换交叉
摘要:相场建模将断裂问题重新表述为能量最小化问题,并能够全面表征断裂过程,包括裂纹的形成、传播、合并和分支,而无需依赖于任意假设。然而,相场断裂问题的数值求解具有高计算成本的特点。为了解决这一挑战,本文采用由分支网络和干网络组成的深度神经运算器(DeepONet)来求解脆性断裂问题。我们探索了三种不同的方法,它们在干网络的配置上有所不同。在第一种方法中,我们展示了两步DeepONet的有效性,从而简化了学习任务。在第二种方法中,我们使用了物理信息指导的DeepONet,其中能量数学表达式被整合到干网络的损失中以确保物理一致性。通过整合物理信息,所需的训练数据量显著减少。在第三种方法中,我们将干网络中的神经网络替换为柯尔莫哥罗夫-阿诺尔德网络,并在没有物理损失的情况下对其进行训练。使用这些方法,我们对在规定端部位移下的一维均质地杆中的裂纹形成进行了建模,还对受拉和剪切载荷作用下具有不同缺口长度的单边缺口试样中的裂纹传播和分支进行了建模。结果显示,网络能够准确预测解场,预测场中的误差主要集中在裂纹附近。
arXiv:2412.16003v2 宣告类型: replace-cross
摘要:使用可解释人工智能(XAI)技术解释机器学习(ML)模型已成为使其更具透明度和可信度的关键。特别是在高风险领域如医疗保健中,理解模型决策对于确保伦理、合理和可信的结果预测至关重要。然而,用户往往对于在特定应用场景中选择哪种解释方法感到困惑。我们对广泛使用的两种解释方法——Shapley 加性解释(SHAP)和梯度加权类激活映射(Grad-CAM)——在人类活动识别(HAR)领域的图卷积网络(GCNs)应用中进行了比较分析。通过在两个现实世界数据集上评估这些方法,包括一个关键的医疗保健脑瘫(CP)案例,本研究为这两种方法的优点、局限性和差异提供了宝贵的见解,提供了基于特定模型和应用选择最合适的解释方法的路线图。我们通过扰动实验,从特征重要性排名、可解释性和模型敏感性等方面定量和定性地比较了这两种方法。虽然SHAP提供了详细的输入特征属性,Grad-CAM提供了更快的空间导向解释,根据应用需求,这两种方法可以互补。鉴于XAI在增强ML模型中的信任和透明度方面的关键作用,特别是在如医疗保健等敏感环境中,我们的研究展示了SHAP和Grad-CAM如何互补,以提供更可解释和可操作的模型解释。
arXiv:2412.15429v4 宣告类型: replace-cross
摘要:脱机安全强化学习(RL)已经成为一种有前途的方法,可以在不与环境进行具有风险的在线交互的情况下学习安全行为。大多数现有的脱机安全RL方法依赖于每一步的时间代价约束(源自全局代价约束),这可能导致过于保守的策略或违反安全约束。在本文中,我们提出了一种学习一种策略的方法,该策略能够生成理想的轨迹并避免不理想的轨迹。具体来说,我们首先将预先收集的状态-动作轨迹数据集划分为理想的和不理想的子集。直观地讲,理想的集合包含高奖励和安全的轨迹,而不理想的集合包含不安全的轨迹和低奖励的安全轨迹。其次,我们学习一种策略,该策略能够生成理想的轨迹并避免不理想的轨迹,其中(不)理想的评分是由从理想的和不理想的轨迹数据集中学习的分类器提供的。这种方法绕过了现有方法中使用的最小-最大目标函数的计算复杂性和稳定性问题。理论上,我们还展示了我们的方法与涉及人类反馈的现有学习范式的紧密联系。最后,我们使用DSRL基准对脱机安全RL方法进行了广泛评估。实证上,我们的方法优于竞争性的基线,实现更高的奖励并在一系列基准任务中更好地满足约束条件。
arXiv:2412.15004v3 通知类型: replace-cross
摘要:大型语言模型(LLMs)已经成为自动化各种编程任务的强大工具,包括安全相关的任务,如检测和修复漏洞。尽管它们具有巨大的潜力,但在要求它们生成或修改已有代码时,LLMs可能会引入未知的漏洞。在分析代码时,它们可能会忽略明显的漏洞或错误地标示不存在的漏洞。在本次系统文献综述(SLR)中,我们的目标是调查LLMs在各种代码相关任务中使用时的安全益处和潜在风险。特别是在使用LLMs生成代码时,我们首先关注LLMs可能引入的漏洞类型。其次,我们分析LLMs在任何给定代码中检测和修复漏洞的能力,并探讨首选提示策略如何影响它们在这两项任务中的性能。最后,我们深入分析了对LLMs的数据投毒攻击如何影响上述任务中的性能。
arXiv:2412.13573v2 公告类型:替换交叉
摘要:域泛化旨在从多个训练域学习一个模型,并将其应用于未见过的测试域。最近的理论已经表明,寻求那些参数位于损失景观平坦极小值中的深层模型可以显著减少域外泛化误差。然而,现有的方法往往忽视不同域中损失景观的连贯性,导致模型无法同时在所有域中位于最佳平坦极小值中,从而限制了其泛化能力。为了解决这一问题,本文提出了一种迭代的自我反馈训练(SFT)框架,通过在训练过程中逐步细化损失景观,寻求在不同域中共享的一致平坦极小值。它通过测量不同域中损失景观的一致性来生成反馈信号,并利用该反馈信号以更高的一致性细化这些损失景观。得益于这些细化后的损失景观中平坦极小值的一致性,我们的SFT有助于实现更好的域外泛化。实验结果表明,DomainBed上的SFT在与最先进的尖锐感知方法和其他流行的域泛化基线相比时,表现更优。在五个域泛化基准中的平均表现上,SFT分别使用ResNet-50和ViT-B/16时,优于尖锐感知最小化2.6%和1.5%。代码将很快发布。
arXiv:2412.12496v4 宣告类型: replace-cross
摘要:Vision Mamba 在计算机视觉任务上表现出接近最先进的性能,引起了提高其效率的广泛关注。一种有前景的方法是标记减少(已在ViTs中成功实现)。在Mamba中减少信息性标记会导致关键知识的重大损失和性能下降。另一个选择,即合并标记保留了比裁剪更多的信息,但同样在大压缩比下表现不佳。我们的关键见解是,在标记合并后进行快速一轮重新训练可以在各种压缩比下获得稳健的结果。实验证明,使用我们提出的框架R-MeeTo后,剪枝Vim在ImageNet-1K上的准确率下降不超过0.9%,并在我们主要评估中得到了恢复。我们展示了如何在分钟级别实现快速恢复并保持简单有效,特别是在对Vim-Ti进行3轮训练后,准确率急剧上升35.9%。此外,Vim-Ti/S/B分别在5/7/17分钟内重新训练,并且Vim-S在加速推理1.2倍(最多1.5倍)的情况下,准确率下降仅为1.3%。