近年来,机器学习 (ML) 模型作为服务 (MLaaS) 在各种生产软件应用程序中的部署显著增加。与此同时,可解释人工智能 (XAI) 不断发展,以解决 ML 模型透明度和可信度的必要性。XAI 技术旨在通过提供关于模型决策过程的见解(以模型解释的形式)来增强 ML 模型的透明度。同时,一些 MLaaS 平台现在除了 ML 预测输出之外还提供解释。这种设置加剧了人们对 MLaaS 漏洞的担忧,特别是在与模型提取攻击 (MEA) 等隐私泄露攻击相关的方面。这是因为解释可以揭示关于模型内部工作原理的见解,这些见解可能会被恶意用户利用。在这项工作中,我们重点研究了模型解释,特别是反事实解释 (CF) 如何被用于在 MLaaS 平台中执行 MEA。我们还深入研究了评估将差分隐私 (DP) 作为缓解策略的有效性。为此,我们首先提出了一种基于知识蒸馏 (KD) 的新 MEA 方法,以提高提取目标模型替代模型的效率,利用 CF,而攻击者无需了解训练数据分布。然后,我们建议了一种方法,用于训练包含 DP 的 CF 生成器以生成私有 CF。我们在真实世界的数据集上进行了全面的实验评估,并证明了我们提出的基于 KD 的 MEA 可以产生高保真度的替代模型,与基线方法相比,查询数量减少。此外,我们的研究结果表明,包含隐私层可以缓解 MEA。然而,由于 CF 的质量,会影响解释的性能。
运动预测对于自主越野驾驶至关重要,然而,由于车辆与地形的复杂交互作用,它比在道路驾驶带来了更大的挑战。传统的基于物理的方法难以准确地模拟动态系统和外部扰动。相比之下,数据驱动的神经网络需要大量的训练数据集,并且难以明确地捕捉基本的物理规律,这很容易导致泛化能力差。通过融合两种方法的优点,神经符号方法展现了一个有前景的方向。这些方法将物理定律嵌入到神经模型中,有可能显著提高泛化能力。然而,以前的工作并没有在越野驾驶的真实环境中进行评估。为了弥合这一差距,我们提出了PhysORD,这是一种神经符号方法,它将守恒定律(即欧拉-拉格朗日方程)集成到数据驱动的用于越野驾驶运动预测的神经模型中。我们的实验表明,PhysORD可以通过建模不确定性来准确预测车辆运动并容忍外部扰动。与数据驱动的方法相比,学习到的动力学模型仅使用3.1%的参数就实现了46.7%更高的精度,这证明了我们的神经符号方法的数据效率和优越的泛化能力。
生成模型能够实现从源图像领域(已存在训练完善的模型)到训练期间未见过的目标领域的转换。虽然循环生成对抗网络 (GAN) 已得到很好的应用,但其相关的循环一致性约束依赖于两个领域之间存在可逆映射。然而,对于用显色单重和双重免疫组化 (IHC) 测定法染色的图像之间的转换,情况并非如此。我们专注于从后者到前者的转换,通过引入一种新的训练设计,提出了一种利用一组免疫荧光 (IF) 图像作为辅助非配对图像领域的替代约束。在后续分割任务上的定量和定性结果表明,与基线方法相比,该方法具有优势。
大型语言模型 (LLM) 能够生成代码,使得创建能够提高开发人员生产力的工具成为可能。开发人员用来编写软件的集成开发环境 (IDE) 通常被用作与 LLM 交互的接口。尽管已经发布了许多此类工具,但几乎所有工具都侧重于通用编程语言。特定领域语言,例如对信息技术 (IT) 自动化至关重要的那些语言,并没有受到太多关注。Ansible 就是一种基于 YAML 的 IT 自动化专用语言。Ansible Lightspeed 是一种基于 LLM 的服务,专门设计用于根据自然语言提示生成 Ansible YAML。
本文介绍了 Ansible Lightspeed 服务的设计和实现。然后,我们使用多种指标评估其对开发人员的效用,包括扩展利用率、用户编辑建议分析以及用户情感分析。评估基于收集的 10696 名真实用户(包括 3910 名回访用户)的数据。Ansible Lightspeed 服务和分析框架的代码已提供给他人使用。
据我们所知,我们的研究首次涉及数千名特定领域语言代码助手用户。我们也是第一个提供 N 天用户留存率数据的代码补全工具,第 30 天的留存率为 13.66%。我们提出了一种改进的用户接受率版本,称为强接受率,其中只有当建议少于 50% 被编辑并且这些编辑不会更改建议的关键部分时,才认为该建议被接受。通过关注 Ansible,Lightspeed 能够实现 49.08% 的多行 Ansible 任务建议的强接受率。通过我们的发现,我们深入了解了小型专用模型在特定领域环境中的有效性。
我们发现神经网络,特别是深度ReLU网络,表现出“过度泛化”现象。也就是说,对于训练过程中未见过的输入,其输出值映射到学习过程中观察到的输出范围附近。换句话说,神经网络学习的是多对一的映射,并且随着网络层数或深度的增加,这种效应更加显著。我们利用神经网络的这一特性设计了一个数据集万花筒,称为“生成式万花筒网络”。简而言之,如果我们学习一个模型将输入$x\in\mathbb{R}^D$映射到自身$f_\mathcal{N}(x)\rightarrow x$,则提出的“万花筒采样”程序从随机输入噪声$z\in\mathbb{R}^D$开始,递归地应用$f_\mathcal{N}(\cdots f_\mathcal{N}(z)\cdots )$。经过一段时间的预热期后,我们开始观察来自输入分布的样本,并且随着模型深度的增加,恢复的样本质量得到提高。范围:我们观察到其他深度学习架构(如CNN、Transformer和U-Net)在不同程度上也存在这种现象,我们目前正在进一步研究。
我们引入了DNABERT-S,这是一个定制的基因组模型,它开发了物种感知嵌入,以自然地将不同物种的DNA序列在嵌入空间中聚类和分离。从基因组序列(即DNA和RNA)中区分物种至关重要,但也极具挑战性,因为许多现实世界中的物种仍未被表征,缺乏已知的基因组作为参考。因此,基于嵌入的方法被用来以无监督的方式区分物种。DNABERT-S建立在一个名为DNABERT-2的预训练基因组基础模型之上。为了鼓励对易出错的长读长DNA序列进行有效的嵌入,我们引入了流形实例混合(MI-Mix),这是一种对比目标,它混合了在随机选择的层上DNA序列的隐藏表示,并训练模型识别和区分输出层中的这些混合比例。我们进一步用提出的课程对比学习(C²LR)策略对其进行了增强。对23个不同数据集的实证结果表明了DNABERT-S的有效性,尤其是在现实的标签稀缺场景中。例如,它从未标记基因组序列的混合物中识别出两倍多的物种,将物种聚类的调整兰德指数(ARI)提高了一倍,并且在仅进行2次训练的情况下,在10次样本物种分类中优于顶级基线的性能。模型、代码和数据已公开发布在\url{https://github.com/MAGICS-LAB/DNABERT_S}。
在机器人学习中,观测空间至关重要,因为不同模态具有独特的特性,这可能成为策略设计之外的瓶颈。本研究探讨了各种观测空间对机器人学习的影响,重点关注三种主要的模态:RGB、RGB-D和点云。我们介绍了OBSBench,这是一个包含两个模拟器和125个任务的基准,以及针对各种编码器和策略基线的标准化流程。对各种接触丰富的操作任务进行的大量实验揭示了一个显著的趋势:基于点云的方法,即使是最简单的设计,也经常优于其RGB和RGB-D对应方法。这种趋势在从头开始训练和利用预训练的两种情况下都持续存在。此外,我们的研究结果表明,点云观测通常可以产生更好的策略性能,并在各种几何和视觉条件下展现出明显更强的泛化能力。这些结果表明,3D点云是复杂机器人任务中一种有价值的观测模态。我们还建议,结合外观和坐标信息可以增强点云方法的性能。我们希望我们的工作能够为设计更具泛化能力和鲁棒性的机器人模型提供宝贵的见解和指导。代码可在https://github.com/HaoyiZhu/PointCloudMatters获取。
基于人类反馈的强化学习(RLHF)是将大型语言模型与人类价值观对齐的一种广泛采用的方法。然而,RLHF依赖于一个用有限数量的人类偏好数据训练的奖励模型,这可能导致预测不准确。结果,RLHF可能会产生与人类价值观不符的输出。为了减轻这个问题,我们提出了一种奖励集成方法,使奖励模型能够做出更准确的预测。由于使用基于大型语言模型的奖励模型集成在计算和资源方面可能代价高昂,我们探索了高效的集成方法,包括线性层集成和基于LoRA的集成。根据经验,我们使用集成的奖励模型运行最佳-N算法和近端策略优化算法,并验证我们的集成方法有助于提高RLHF输出的对齐性能。
基于Transformer的目标重识别综述:方法、基准和未来方向。目标重识别旨在跨不同时间和场景识别特定物体,是计算机视觉领域一个广泛研究的任务。长期以来,该领域主要由基于卷积神经网络的深度学习技术驱动。近年来,视觉Transformer的出现激发了许多研究深入探究基于Transformer的目标重识别,不断刷新性能记录,并在目标重识别领域取得显著进展。Transformer提供了一种强大、灵活且统一的解决方案,以无与伦比的效率满足各种目标重识别任务的需求。本文对基于Transformer的目标重识别进行了全面综述和深入分析。通过将现有工作分类为基于图像/视频的目标重识别、数据/标注有限的目标重识别、跨模态目标重识别和特殊目标重识别场景,我们彻底阐明了Transformer在解决这些领域众多挑战中所展现的优势。考虑到趋势性的无监督目标重识别,我们提出了一种新的Transformer基线UntransReID,在单模态/跨模态任务上都取得了最先进的性能。对于尚未充分探索的动物目标重识别,我们设计了一个标准化的实验基准,并进行了大量的实验,以探索Transformer在此任务中的适用性并促进未来的研究。最后,我们讨论了大型基础模型时代一些重要但尚未充分研究的开放性问题,我们相信这将成为该领域研究人员的新手册。一个定期更新的网站将提供在https://github.com/mangye16/ReID-Survey。
原子拥塞博弈是网络设计、路由和算法博弈论中的一个经典课题,能够模拟各种应用领域中的拥塞和流量优化任务。虽然这类博弈的无政府状态价格以及计算其纳什均衡的计算复杂度现在已被很好地理解,但计算系统最优策略集(即,最小化代理平均成本的集中式规划路由)的计算复杂度在文献中却严重缺乏研究。我们通过参数化复杂性范式的视角,确定了该问题易处理性的精确边界,从而弥补了这一差距。在证明即使在极其简单的网络上,该问题仍然具有很高的计算复杂性之后,我们获得了一组结果,这些结果表明控制该问题计算(不)易处理性的结构参数本质上不是基于顶点分离器(例如,树宽),而是基于边分离器。最后,我们将分析扩展到该问题的(更具挑战性的)最小-最大变体。