人工智能对齐领域致力于引导人工智能系统朝着人类的目标、偏好和伦理原则发展。其贡献极大地提升了当今人工智能模型的输出质量、安全性和可信度。本文探讨了我们在所有人工智能对齐工作中都面临的一个根本性挑战,我们称之为“人工智能对齐悖论”:我们越能使人工智能模型与我们的价值观相符,就越可能使对手更容易使其偏离正轨。我们通过勾勒出针对语言模型的三个具体示例来阐述这一悖论,每个示例都对应着对手可能利用该悖论的不同方式。随着人工智能对现实世界影响的日益增强,迫切需要广大研究人员意识到人工智能对齐悖论,并努力寻找减轻其影响的方法,以确保人工智能造福人类。
随着大型语言模型(LLM)根据规模法则不断发展,来自人类反馈的强化学习(RLHF)因其卓越的性能而受到广泛关注。然而,与预训练或微调单个模型不同,针对大型语言模型的来自人类反馈的强化学习(RLHF)的扩展在四个模型之间带来了协调方面的挑战。我们提出了OpenRLHF,一个支持高效RLHF扩展的开源框架。与将四个模型放在同一GPU上的现有RLHF框架不同,OpenRLHF利用Ray、vLLM和DeepSpeed,重新设计了参数超过700亿的模型调度,从而提高了资源利用率并采用了多种训练方法。OpenRLHF与Hugging Face无缝集成,提供了一个具有优化算法和启动脚本的开箱即用解决方案,确保了用户友好性。OpenRLHF实现了RLHF、DPO、拒绝采样和其他对齐技术。OpenRLHF的代码现已开源,可用于支持最先进的LLM开发,地址为\url{https://github.com/OpenRLHF/OpenRLHF}。
人工智能(AI)的演进深刻地影响了人类社会,推动了多个领域的重大进步。通用人工智能(AGI)能够高效有效地执行各种现实世界的任务,其能力与人类智能相当,代表着人工智能发展的一个重要里程碑。虽然现有研究回顾了人工智能的具体进展,并提出了通往AGI的潜在途径,例如大型语言模型(LLMs),但它们未能对AGI的定义、目标和发展轨迹进行彻底的探讨。与之前的综述论文不同,本文超越了对大型语言模型的总结,通过全面的分析、深入的讨论和新颖的见解,探讨了我们在通往AGI的道路上取得的进展,并概述了实现AGI的必要策略。我们首先阐明了AGI所需的各项能力框架,整合了内部、接口和系统三个维度。由于AGI的实现需要更先进的能力和对严格约束的遵守,我们进一步讨论了必要的AGI对齐技术以协调这些因素。值得注意的是,我们强调负责任地发展AGI的重要性,首先定义AGI发展过程中的关键阶段,然后给出评估框架来定位现状,最后给出我们实现AGI顶峰的路线图。此外,为了对人工智能集成带来的普遍影响提供切实的见解,我们概述了多个领域中通往AGI的现有挑战和潜在途径。总之,本文作为对AGI现状和未来发展轨迹的开创性探索,旨在促进研究人员和实践者对AGI的集体理解,并催化更广泛的公众讨论。
近年来,基于监督学习 (SL) 和信道状态信息 (CSI) 的室内人体存在检测受到了广泛关注。然而,现有依赖于 CSI 空间信息的研究所受到环境变化的影响,导致预测精度下降。此外,基于 SL 的方法需要耗时的数据标注来重新训练模型。因此,设计一个使用基于半监督学习 (SSL) 的方案进行持续监控的模型势在必行。本文提出了一种用于相邻两室场景中室内人体存在检测的双重师生 (BTS) 学习方法。提出的基于 SSL 的原始-对偶师生网络能够智能地从标记和未标记的 CSI 数据集中学习时空特征。此外,增强的惩罚损失函数利用熵和距离度量来区分漂移数据,即受时变效应影响并偏离原始分布的新数据集的特征。实验结果表明,在使用未标记数据重新训练模型后,所提出的 BTS 系统实现了约 98% 的平均准确率。在布局和环境发生变化的情况下,BTS 可以维持 93% 的准确率。此外,BTS 在检测精度方面优于现有的基于 SSL 的模型,最高检测精度约为 98%,同时达到了基于 SL 的方法的渐近性能。
美国人口普查局等机构发布的关于个人群体的数集和统计数据,被用作许多关键决策过程的输入。为了符合隐私和保密要求,这些机构通常需要发布经过隐私保护处理的数据版本。本文研究了差分隐私数据集的发布及其对公平视角下一些关键资源分配任务的影响。当决策以差分隐私数据为输入时,为实现隐私而添加的噪声会不成比例地影响某些群体。本文分析了这些不成比例影响的原因,并提出了减轻这些影响的指导方针。所提出的方法在使用差分隐私人口普查数据的关键决策问题上进行了评估。
多目标最短路径 (MOS) 问题旨在在一个多属性图中找到从起始节点到目标节点的一组帕累托最优解。为了解决这个 NP 难的 MOS 问题,文献中探索了启发式多目标 A* 风格的算法方法。一种通用的 MOS 算法在每个节点维护一个部分路径的“前沿”,并执行有序处理以确保生成到达目标节点的帕累托最优路径。由于非支配路径数量迅速增加以及帕累托最优解数量随之大幅增加,该算法在目标数量增加时变得难以计算。虽然先前的工作侧重于降低复杂性的算法方法,但我们通过使用算法-架构方法利用并行性来应对这一挑战。关键在于 MOS 算法依赖于部分路径的有序执行以保持高工作效率。本文提出的 OPMOS 框架解锁了有序并行性,并有效地利用了 MOS 中多条路径的并发执行。使用 NVIDIA GH200 超级芯片进行的实验评估表明,OPMOS 在工作效率和并行性方面具有性能扩展潜力,并使用现实世界的船舶航线应用进行了验证。
我们提出了一种名为CatNet的算法,该算法能够有效控制错误发现率(FDR)并在结合高斯镜像(GM)方法的长短期记忆网络(LSTM)中选择显著特征。为了评估时间序列中LSTM的特征重要性,我们引入了一种基于SHapley Additive exPlanations (SHAP)导数的向量来衡量特征重要性。我们还提出了一种新的基于核的依赖性度量方法,以避免GM算法中的多重共线性问题,从而实现具有受控FDR的稳健特征选择。我们使用模拟数据评估了CatNet在具有不同链接函数的线性模型和LSTM模型中的性能。该算法在所有情况下都能有效控制FDR,同时保持较高的统计功效。我们还在不同的低维和高维情况下评估了该算法的性能,证明了其在各种输入维度下的稳健性。为了评估CatNet在实际应用中的性能,我们构建了一个多因素投资组合来预测标准普尔500指数成分股的价格。结果表明,与没有特征选择和FDR控制的传统LSTM模型相比,我们的模型实现了更高的预测精度。此外,CatNet有效地捕捉了常见的市场驱动因素,这通过增强预测的可解释性,有助于在金融市场中做出明智的决策。我们的研究首次将高斯镜像算法与LSTM模型相结合,并将SHAP值作为FDR控制方法中的一种新的特征重要性度量指标,这标志着神经网络特征选择和误差控制方面的一项重大进展。
故事视频生成 (SVG) 最近出现,其任务是创建长的、多动作的、多场景的视频,这些视频一致地展现输入文本脚本中描述的故事。SVG 在媒体和娱乐的多样化内容创作方面具有巨大潜力;然而,它也带来了巨大的挑战:(1)物体必须展现一系列细粒度、复杂的动作;(2)多个物体需要在各个场景中始终如一地出现;(3)主体可能需要多个动作,并在单个场景内实现无缝过渡。为了应对这些挑战,我们提出了 DreamRunner,这是一种新颖的故事到视频生成方法:首先,我们使用大型语言模型 (LLM) 来构建输入脚本,以促进粗粒度的场景规划以及细粒度的物体级布局和运动规划。接下来,DreamRunner 提出了一种检索增强的测试时自适应方法,以捕获每个场景中物体的目标运动先验,支持基于检索视频的多样化运动定制,从而促进生成具有复杂脚本动作的新视频。最后,我们提出了一种新颖的基于时空区域的 3D 注意力和先验注入模块 SR3AI,用于细粒度的物体运动绑定和逐帧语义控制。我们将 DreamRunner 与各种 SVG 基线进行了比较,证明了其在角色一致性、文本对齐和平滑过渡方面取得了最先进的性能。此外,DreamRunner 在组合文本到视频生成方面表现出强大的细粒度条件遵循能力,在 T2V-ComBench 上显著优于基线。最后,我们通过定性示例验证了 DreamRunner 生成多物体交互的强大能力。
奖励建模对于使大型语言模型 (LLM) 与人类偏好保持一致至关重要,尤其是在基于人类反馈的强化学习 (RLHF) 中。然而,目前的奖励模型主要产生标量分数,难以整合自然语言形式的批评意见。我们假设预测批评意见和标量奖励都能提高奖励建模能力。基于此,我们提出了 Critic-RM 框架,该框架无需额外监督即可利用自生成的批评意见来改进奖励模型。Critic-RM 采用两阶段过程:生成和过滤高质量的批评意见,然后对奖励预测和批评意见生成进行联合微调。跨基准的实验表明,与标准奖励模型和 LLM 评判相比,Critic-RM 将奖励建模精度提高了 3.7%-7.3%,展现出强大的性能和数据效率。额外的研究进一步验证了生成的批评意见在纠正有缺陷的推理步骤方面的有效性,推理精度提高了 2.5%-3.2%。
在推荐系统领域,绝大部分的研究工作都致力于开发越来越复杂的推荐模型,同时也使用了越来越多的计算资源。然而,这些研究工作大多针对非常有限的应用领域,主要集中在电子商务和媒体推荐。此外,许多模型从未经过用户评估,更不用说实际应用了。因此,学者们的大部分努力在科学、经济和社会价值方面仍然不清楚。为了实现这些努力带来的更强的积极影响,我们认为,作为研究团体,我们应该更频繁地关注推荐系统有助于社会公益(RS4Good)的用例。在这篇观点文章中,我们首先讨论了一些例子,这些例子表明文献中已经成功探索了将推荐系统用于社会关注问题的案例。然后,我们概述了开展成功的 RS4Good 研究所需的范式转变,其关键要素是跨学科合作和包含人类参与的纵向评估方法。