arXiv:2505.08878v1 宣告类型:交叉
摘要:大型语言模型(LLMs)现在已经能够在许多情况下产生看起来与人类生成的内容无法区分的文本。这促进了在微小扰动LLM输出的情况下,能够在LLM生成的文本中嵌入“信号”的水印的发展。本文提供了在一次完成设置下对文本水印技术的分析。通过假设检验与侧信息的视角,我们提出了并分析了在检测水印能力与生成文本质量扰动之间的基本权衡。我们认为,水印设计的关键组件是在与水印检测器共享的侧信息和LLM词汇的随机划分之间建立耦合。我们的分析确定了在最小熵约束下满足最坏情况的LLM下一个词分布的最优耦合和随机化策略。我们提供了在所提议方案下结果检测率的闭式表达式,并在最大最小意义上量化了成本。最后,我们在合成数据和LLM水印方面提供了大量的数值结果,将所提议方案与理论最优方案及现有方案进行了比较。我们的代码可在 https://github.com/Carol-Long/CC_Watermark 获得。
arXiv:2505.08854v1 交叉类型: cross
摘要: 生成式人工智能(GenAI)构成了一个变革性的技术浪潮,通过其无与伦比的内容创作、推理、规划和多模态理解能力重新配置各行各业。这一革命性的力量为解决工程领域最具挑战性的任务之一——实现可靠、完全自主驾驶,特别是L5级自主驾驶——提供了迄今为止最令人振奋的道路。这篇综述为自主驾驶堆栈中生成式人工智能的新兴作用提供了全面而批判性的综述。我们首先提炼出现代生成建模的基本原则和权衡,包括VAE、GAN、扩散模型和大型语言模型(LLM)。然后,我们映射它们在图像、LiDAR、轨迹、占用、视频生成以及LLM引导的推理和决策方面的前沿应用。我们对实用应用进行了分类,如合成数据工作流程、端到端驾驶策略、高保真数字孪生系统、智能交通网络以及向具身人工智能领域的跨域迁移。我们指出了关键的障碍和可能性,如对罕见情况的全面泛化、评估和安全性检查、预算限制下的实施、监管合规性、伦理问题以及环境影响,同时还提出了理论保证、信任指标、运输集成和社会技术影响方面的研究计划。通过统一这些线索,综述为研究人员、工程师和政策制定者在生成式人工智能和高级自主移动领域的融合中提供了一个前瞻性参考。参考文献的活跃维护库可在https://github.com/taco-group/GenAI4AD 获取。
arXiv:2505.08849v1 类型: cross
摘要:语言模型对齐对于确保大型语言模型(LLMs)与人类偏好相一致至关重要,但这一过程往往涉及敏感的用户数据,从而引发重大的隐私担忧。尽管先前的工作将差分隐私(DP)与对齐技术融为一体,但其性能仍然有限。在这篇论文中,我们提出了新的隐私保护对齐算法,并严格分析了其在不同隐私预算和模型下的有效性。我们的框架可以在两种著名的对齐技术,即直接偏好优化(DPO)和基于人类反馈的强化学习(RLHF)中部署。通过大规模语言模型的系统实验表明,我们的方法在性能上达到了最新水平。值得注意的是,我们的算法之一,结合了DPO的DP-AdamW,在中等隐私预算(ε=2-5)下,超越了现有方法,提高了对齐质量高达15%。我们还进一步探讨了隐私保证、对齐效果和计算需求之间的相互作用,提供了优化这些权衡的实际指南。
arXiv:2505.08847v1 宣布类型:交叉
摘要:机器学习即服务(MLaaS)因其部署强大预测模型的能力而获得了重要关注,提供了便捷的方式,使组织能够利用高级分析,而无需在专用基础设施或专业知识方面进行重大投资。然而,MLaaS平台必须防范诸如模型提取(MEA)等安全和隐私攻击。随着解释性AI(XAI)在MLaaS中的集成程度不断提高,这引入了额外的隐私挑战,因为攻击者可以利用模型解释,尤其是反事实解释(CFs),来促进MEA。在本文中,我们研究了在采用差分隐私(DP)时,模型性能、隐私和解释性之间的权衡。差分隐私是一种有前景的技术,用于缓解CF促进的MEA。我们评估了两种不同的DP策略:一种是在分类模型训练期间实施,另一种是在生成CF时由解释器实施。
arXiv:2505.08846v1 交叉类型: cross
摘要: 在本文中,我们引入了一些度量标准,用于评估简化时间序列在时间序列分类器(TSC)可解释性方面的应用。这些简化是重要的,因为与文本和图像数据不同,时间序列数据对人类来说不是直观可理解的。这些度量标准与简化的时间序列复杂度——它们包含的段数——以及它们在保持原时间序列分类方面的一贯性相关。我们使用这些度量标准评估了四种不同的简化算法,在多个TSC算法以及具有不同特征的数据集(包括季节性或平稳的、短或长的时间序列)上进行评估。我们的研究结果表明,在时间序列是季节性、非平稳和/或低熵的情况下,使用简化的时间序列进行TSC的可解释性比使用原始时间序列要好得多。
arXiv:2505.08845v1 类型: cross
摘要:基于深度学习的宫颈癌分类有可能增加低资源地区筛查的可访问性。然而,深度学习模型往往过于自信,不能可靠地反映诊断不确定性。此外,它们通常优化为生成最大似然预测,这无法传达结果中的不确定性或模糊性。这些问题可以通过使用校准预测来解决,校准预测是一种通用框架,用于为训练好的深度学习模型生成包含可能类别的预测集。这些预测集的大小指示了模型的不确定性,随着模型信心增加而收缩。然而,现有的校准预测评估主要集中在预测集是否包含或覆盖真实类别上,经常忽视多余类别的存在。我们认为预测集应该是真实的且对最终用户有价值,确保列出的可能类别与人类预期一致,而不是过于宽松,包括虚假正例或不太可能的类别。在本次研究中,我们使用来自多名标注者的专家标注集全面验证了校准预测集。我们评估了三种应用于三种训练好的用于宫颈不典型分类的深度学习模型的校准预测方法。我们的基于专家标注的分析表明,传统的覆盖率评估高估了性能,当前的校准预测方法通常生成的预测集与人类标签不匹配。此外,我们还探索了校准预测方法在识别模糊和分布外数据方面的能力。
arXiv:2505.08844v1 Announce Type: cross
摘要:细胞类型注释是单细胞RNA测序分析中的一个关键但劳动密集型步骤。我们介绍了一种可信的大语言模型(LLM)代理CellTypeAgent,它将LLM与相关数据库的验证相结合。CellTypeAgent比现有方法在准确性和减轻幻觉方面均有所提高。我们在涉及36种组织和303种细胞类型的九个真实数据集中评估了CellTypeAgent。这种结合方法有望实现更加高效和可靠的细胞类型注释。
arXiv:2505.08841v1 类别: cross
摘要: 随着人工智能和机器人技术不断重塑全球劳动力市场,了解公众对这些技术的看法变得至关重要。我们利用拉丁美洲拉丁obar\'ometro 2017、2018、2020 和 2023 波次的调查数据,研究了这些看法在拉丁美洲的发展演变情况。通过分析来自 16 个国家超过 48,000 人的回应,我们分析了人们因人工智能和机器人技术而产生的就业恐惧。利用统计建模和潜在类别分析,我们识别出关键的结构和意识形态预测因素,其中教育水平和政治倾向是最具一致性的驱动因素。我们的研究结果揭示了显著的时间性和跨国性差异,特别是在 2018 年存在明显的恐惧高峰,并且潜在分段产生了独特的态度模式。这些结果为新兴经济体中人工智能焦虑的社会和结构性维度提供了新的见解,并为对自动化持公民主观态度的研究做出了更广泛的贡献,而不仅仅限于全球经济体的北方。
arXiv:2505.08838v1 跨语种报告生成类型:统一体系
摘要:超声(US)报告生成是一项具有挑战性的任务,由于US图像的变异性、操作者依赖性以及需要标准化文本。与X光和CT不同,US成像缺乏一致的数据集,使自动化变得困难。在此研究中,我们提出了一种多器官和跨语种US报告生成的统一体系框架,该框架结合了基于片段的跨语种训练,并利用US报告的标准化特性。通过将模块化文本片段与多样化的影像数据对齐,并建立一个双语英语-汉语数据集,该方法实现了跨器官位置和语言的一致且临床准确的文本生成。使用选择性解冻的视觉变换器(ViT)进行微调进一步提高了文本-影像对齐。与之前的最佳方法KMVE方法相比,我们的方法在BLEU分数上获得了大约2%的相对收益,在ROUGE-L上获得了约3%的相对收益,在CIDEr上获得了约15%的相对收益,同时显著减少了诸如内容缺失或错误等错误。通过将多器官和多语言报告生成统一为一个可扩展的框架,这项工作展示了在实际临床工作流程中强大的潜力。
arXiv:2505.08835v1 交叉类型: cross
摘要:方便高效的配备有基于人工智能的自动化结账系统的无人商店的出现标志着零售业的新时代。然而,这些系统本身存在固有的人工智能安全漏洞,这些漏洞通过对抗性补丁攻击在物理环境中被利用。本研究证明,对抗性补丁可以严重破坏无人商店中使用的对象检测模型,导致诸如盗窃、库存差异和干扰等问题。我们调查了三种类型的对抗性补丁攻击——隐藏攻击、创造攻击和改变攻击,并强调了它们的有效性。我们还通过利用攻击者对目标类对象颜色信息的了解,引入了新颖的颜色直方图相似度损失函数。除了传统的基于混淆矩阵的攻击成功率外,我们还引入了一种基于边界框的度量来分析这些攻击的实际影响。从对数字环境中零食和水果数据集训练的对象检测模型的攻击开始,我们在一个模拟真实无人商店的物理试验台中进行了评估,该试验台使用了RGB摄像头和现实条件。此外,我们评估了这些攻击在黑盒场景中的稳健性,展示了即使没有直接访问模型参数也能通过阴影攻击提高攻击成功率。我们的研究强调了需要强大的防御策略来保护无人商店免受对抗性威胁的必要性。我们指出现有检测系统的防护机制的局限性,并讨论了各种主动措施,提供有关提高对象检测模型的稳健性以及增强无人零售环境抵御这些攻击的见解。