开发安全的代理人工智能系统得益于符合人类价值观的自动化实证测试,而这一子领域目前尚处于发展初期。为了对此做出贡献,本研究重点介绍了现代强化学习文献中安全方面被忽视的生物学和经济学主题,即稳态、平衡多个目标、有限目标、收益递减、可持续性和多智能体资源共享。我们针对上述主题实施了八个主要基准环境,以说明当前关于人工智能安全的主流讨论中可能存在的缺陷。
作为以用户为中心的工具,代理越来越多地被用于人类任务委托,通过生成想法、与用户代理互动以及制定行动计划来协助各种请求。然而,基于大型语言模型 (LLMs) 的代理通常面临着巨大的规划延迟,这主要归因于两个因素:基础 LLMs 由于其庞大规模和高需求而存在的效率限制,以及代理由于生成大量中间想法以产生最终输出而导致的结构复杂性。鉴于服务提供效率低下会损害自动化对用户的价值,本文提出了一种以人为中心的有效代理规划方法——交互式推测规划——旨在通过系统设计和人机交互来提高代理规划的效率。我们的方法主张共同设计代理系统和用户界面,强调了能够流畅地管理用户交互和中断的代理系统的必要性。通过将人类中断作为系统的一个基本组成部分,我们不仅使其更加以用户为中心,而且还通过利用人机交互来提供准确的中间步骤,从而加速整个过程。代码和数据将发布。
针对操控任务的终身模仿学习,由于增量学习步骤中发生的分布偏移,带来了巨大的挑战。现有方法通常专注于无监督技能发现以构建不断增长的技能库,或从多个策略中进行蒸馏,这会导致可扩展性问题,因为各种操控任务不断被引入,并且可能无法确保整个学习过程中一致的潜在空间,从而导致先前学习的技能发生灾难性遗忘。本文介绍了 M2Distill,一种基于多模态蒸馏的终身模仿学习方法,专注于在整个学习过程中保持视觉、语言和动作分布的一致潜在空间。通过调节先前步骤到当前步骤的不同模态之间潜在表示的偏移,并减少连续学习步骤之间高斯混合模型 (GMM) 策略的差异,我们确保学习到的策略保留其执行先前学习的任务的能力,同时无缝地整合新技能。在 LIBERO 终身模仿学习基准套件(包括 LIBERO-OBJECT、LIBERO-GOAL 和 LIBERO-SPATIAL)上进行的大量评估表明,我们的方法在所有评估指标上始终优于现有最先进的方法。
近年来,Transformer 架构在模式识别和机器学习的许多领域取得了重大进展。然而,与其他神经网络模型一样,目前还没有通用的方法来解释它们的内部工作机制。本文代表了朝着这个方向迈出的第一步。我们利用 *Transformer Compiler for RASP* (Tracr) 生成一个大型数据集,其中包含 Transformer 权重和相应的 RASP 程序对。基于此数据集,我们构建并训练了一个模型,旨在从编译后的模型中恢复 RASP 代码。我们证明,Tracr 编译后的 Transformer 权重的简单形式对于这种反编译模型来说是可解释的。在实证评估中,我们的模型在超过 30% 的测试对象上实现了精确复制,而其余 70% 通常只需要少量错误就可以复制。此外,超过 70% 的程序,由我们的模型生成,在功能上等同于基本事实,因此是 Tracr 编译后的 Transformer 权重的有效反编译。
深度神经网络 (DNN) 模型的非法复制、分发和衍生可能会造成经济损失、声誉损害甚至隐私侵犯。诸如水印和指纹之类的被动 DNN 知识产权 (IP) 保护方法试图在 IP 违反时证明所有权,但它们往往为时已晚,无法阻止 IP 滥用造成的灾难性损害,并且对抗强大的对手也过于薄弱。在本文中,我们提出了 IDEA,一种基于逆域专家自适应的主动 DNN IP 保护方法,它具有主动授权和源可追溯性。IDEA 将主动授权概括为域自适应的逆问题。多自适应优化通过具有一个真实专家和两个虚假专家的混合专家模型来解决。真实专家重新优化源模型以正确分类测试图像,其中包含以隐写术嵌入的唯一模型用户密钥。虚假专家经过训练,在没有或有错误的用户密钥嵌入的情况下对测试图像输出随机预测,方法是最大程度地减少它们与真实专家的互信息 (MI)。MoE 模型被知识蒸馏到一个统一的受保护模型中,以避免通过最大程度地提高它们与额外的多层注意力和对比表示损失优化之间的 MI 来泄露专家模型特征。IDEA 不仅可以防止未经授权的用户在没有有效密钥的情况下访问功能模型,还可以使模型所有者验证已部署的模型并追溯 IP 侵权的来源。我们在五个数据集和四个 DNN 模型上对 IDEA 进行了广泛的评估,以证明其在授权控制、罪魁祸首追踪成功率和针对各种攻击的鲁棒性方面的有效性。
由于高维状态空间的存在,视觉强化学习 (RL) 在利用和探索方面面临着重大挑战,导致样本效率低下和训练不稳定。虽然一致性模型作为一种时间效率高的扩散模型已在基于在线状态的 RL 中得到验证,但它是否可以扩展到视觉 RL 仍然是一个开放性问题。本文研究了非平稳分布和演员-评论家框架对在线 RL 中一致性策略的影响,发现一致性策略在训练过程中不稳定,尤其是在具有高维状态空间的视觉 RL 中。为此,我们建议使用基于样本的熵正则化来稳定策略训练,并提出了一种具有优先级近端经验正则化的一致性策略 (CP3ER) 来提高样本效率。CP3ER 在 DeepMind 控制套件和 Meta-world 的 21 个任务中取得了新的最先进 (SOTA) 性能。据我们所知,CP3ER 是第一个将扩散/一致性模型应用于视觉 RL 的方法,并展示了一致性模型在视觉 RL 中的潜力。更多可视化结果请访问 https://jzndd.github.io/CP3ER-Page/。
有效的流行病预测对于公共卫生策略和医疗资源的有效分配至关重要,尤其是在快速传播的传染病面前。然而,现有的深度学习方法往往忽略了流行病的动态特性,并且没有考虑到疾病传播的具体机制。为了应对这些挑战,本文提出了一种名为“具有连续疾病传播图的流行病感知神经常微分方程 (EARTH)” 的端到端创新框架。为了学习连续和区域性的疾病传播模式,我们首先提出了 EANO,它将神经常微分方程方法与流行病机制无缝整合,考虑了流行病演变过程中的复杂空间传播过程。此外,我们引入了 GLTG 来模拟全球感染趋势,并利用这些信号来动态指导局部传播。为了同时适应流行病趋势的全球一致性和流行病传播模式的局部细微差别,我们构建了一种交叉注意机制,以融合最具意义的信息进行预测。通过这两个组件的平滑协同,EARTH 为理解和预测传染病的传播提供了更加稳健和灵活的方法。大量实验表明,与最先进的方法相比,EARTH 在预测现实世界中的流行病方面表现出优异的性能。代码将发布在 https://github.com/Emory-Melody/EpiLearn。
随着科技的快速发展,区块链和人工智能技术在各行各业发挥着巨大作用。在金融领域,区块链凭借其去中心化和安全性的优势,解决了传统系统数据存储和管理中的许多安全问题。而人工智能凭借其强大的算法建模能力,在金融预测和风险管理方面具有巨大优势。利用区块链和人工智能技术进行金融违约预测是一个非常强大的应用。区块链技术保证了数据的可信度和所有节点的一致性,机器学习通过对海量数据的详细分析构建了高水平的违约预测模型。本研究为金融机构在信用风险缓解和金融体系稳定方面提供了关于金融科技的新思路。
我们介绍了 Moshi,一个语音-文本基础模型和全双工口语对话框架。当前的口语对话系统依赖于独立组件的流水线,即语音活动检测、语音识别、文本对话和文本到语音。此类框架无法模拟真实对话的体验。首先,它们的复杂性会导致交互之间几秒钟的延迟。其次,文本是对话的中间媒介,修改意义的非语言信息(如情绪或非语音声音)在交互中丢失。最后,它们依赖于对说话人轮次的分割,这没有考虑重叠语音、打断和插入语。Moshi 通过将口语对话视为语音到语音生成来解决这些独立问题。从文本语言模型主干开始,Moshi 从神经音频编解码器的残差量化器生成语音作为标记,同时分别将自身语音和用户语音建模为并行流。这允许删除显式说话人轮次,并对任意对话动态进行建模。此外,我们将之前工作的分层语义到声学标记生成扩展到首先预测时间对齐的文本标记作为音频标记的前缀。这种“内心独白”方法不仅显着提高了生成的语音的语言质量,而且我们还说明了它如何提供流式语音识别和文本到语音。我们得到的模型是第一个实时全双工口语大型语言模型,理论延迟为 160 毫秒,实际延迟为 200 毫秒,可在 https://github.com/kyutai-labs/moshi 获取。
进行高效且有效的用户体验(UX)访谈通常会遇到挑战,例如保持对关键主题的关注以及管理访谈时长和访谈后分析。为了解决这些问题,本文介绍了 InsightPulse,一个基于物联网(IoT)的软硬件系统,旨在通过语音分析和人工智能来简化和增强 UX 访谈流程。InsightPulse 在用户访谈过程中提供实时支持,通过自动识别和突出显示关键讨论点,主动建议后续问题以及生成主题摘要。这些功能能够带来更深刻的发现并帮助有效地管理访谈时长。此外,该系统还配备了一个强大的后端分析仪表板,简化了访谈后的审查流程,从而便于快速提取可操作的见解并提高整体 UX 研究效率。