LLM2D

arXiv 论文列表

作者: Benedikt Alkin, Andreas F\"urst, Simon Schmid, Lukas Gruber, Markus Holzleitner, Johannes Brandstetter
神经算子作为物理代理模型,最近受到了越来越多的关注。随着问题复杂性的不断增加,一个自然而然的问题出现了:如何有效地将神经算子扩展到更大、更复杂的模拟中——最重要的是,如何考虑不同类型的模拟数据集。这一点尤其重要,因为与它们的数值对应物类似,即使系统的潜在动力学相似,不同的技术也会在不同的应用中使用。虽然 Transformer 的灵活性使得跨领域的统一架构成为可能,但神经算子大多遵循特定问题的设计,其中图神经网络 (GNN) 通常用于拉格朗日模拟,而基于网格的模型则在欧拉模拟中占主导地位。我们引入了通用物理Transformer (UPT),这是一种高效且统一的学习范式,适用于各种时空问题。UPT无需基于网格或粒子的潜在结构,从而能够在网格和粒子之间灵活扩展。UPT有效地在潜在空间中传播动力学,这通过逆编码和解码技术得到强调。最后,UPT允许在时空中的任何点查询潜在空间表示。我们在基于网格的流体模拟、稳态雷诺平均Navier-Stokes模拟和基于拉格朗日的动力学中证明了UPT的多样化适用性和有效性。
发布时间: 10/10/2024
查看原文
作者: Christophe Roux, Max Zimmer, Sebastian Pokutta
基于知识蒸馏的联邦学习算法因其在隐私保护、非独立同分布数据和通信成本方面的优势而受到越来越多的关注。这些方法不再传输模型参数,而是通过在公共数据集上共享预测来交流学习任务信息。本研究探讨了此类方法在拜占庭环境下的性能,在该环境中,一部分客户端会以对抗性方式行事,试图破坏学习过程。我们证明了基于知识蒸馏的联邦学习算法具有显著的鲁棒性,并分析了拜占庭客户端如何影响学习过程。基于这些见解,我们引入了两种新的拜占庭攻击,并证明了它们破坏现有拜占庭鲁棒方法的能力。此外,我们提出了一种新的防御方法,增强了基于知识蒸馏的联邦学习算法的拜占庭鲁棒性。最后,我们提供了一个通用的攻击混淆框架,使其更难以检测,从而提高其有效性。我们的研究结果为拜占庭联邦学习的分析提供了重要的基础,通过开发新的攻击和新的防御机制,进一步提高了基于知识蒸馏的联邦学习算法的鲁棒性。
发布时间: 10/10/2024
查看原文
作者: Yoonjeong Park, Hyunjin Kim, Chanyeol Choi, Junseong Kim, Jy-yong Sohn
链式思维(CoT)提示是一种简单有效的方法,可以提高大型语言模型(LLM)的推理能力。CoT的基本思想是通过在输入提示中添加示例,让LLM逐步分解其思维过程。然而,CoT密集结构的提示示例可能会导致LLM的认知超载。受人类认知的启发,我们引入了COT-SEP,这是一种在CoT提示中每个示例末尾策略性地使用分隔符的方法。这些分隔符旨在帮助LLM在推理过程中更好地理解其思维过程。有趣的是,与不使用分隔符的普通CoT相比,COT-SEP显著提高了LLM在复杂推理任务(例如GSM8K、AQuA、CSQA)上的性能。我们还研究了在包括GPT-3.5-Turbo、GPT-4和LLaMA-2 7B在内的多个LLM上测试的分隔符类型和位置的影响。
发布时间: 10/10/2024
查看原文
作者: Maria B{\aa}nkestad, Jennifer R. Andersson, Sebastian Mair, Jens Sj\"olund
基于Ising模型的图结构子采样方法,该方法通过在节点或边上定义Ising模型并使用图神经网络学习Ising模型的外部磁场来实现图结构的子采样。该方法针对特定任务,能够以端到端的方式学习如何针对特定下游任务简化图结构,并且下游任务的损失函数无需可微。我们在四个不同的应用中展示了该方法的多功能性:图像分割、图分类的可解释性、三维形状稀疏化和稀疏近似矩阵逆的确定。
发布时间: 10/10/2024
查看原文
作者: Agus Hartoyo, Jan Argasi\'nski, Aleksandra Trenk, Kinga Przybylska, Anna B{\l}asiak, Alessandro Crimi
协方差矩阵和Hessian矩阵在文献中被分别用于分析分类问题。然而,整合这两种矩阵有可能增强其组合能力,从而提高分类性能。我们提出了一种新方法,该方法结合了在训练集上评估的协方差矩阵的特征分析和在深度学习模型上评估的Hessian矩阵,以实现二元分类任务中的最优类可分性。我们的方法得到了形式化证明的支持,这些证明确立了其最大化类间均值距离(“分离”的概念)和最小化类内方差(“紧凑性”的概念)的能力,这两者共同定义了线性判别分析(LDA)的两个标准,尤其是在理想数据条件下,例如围绕类均值的各向同性和主要的领先特征值。通过将数据投影到来自这两个矩阵的最相关特征方向的组合空间中,我们根据这些LDA标准实现了最优类可分性。在神经和健康数据集上的实证验证一致地支持我们的理论框架,并证明我们的方法优于已建立的方法。我们的方法通过同时解决分离和紧凑性标准而脱颖而出,这与主要强调每个标准的一种的PCA和Hessian方法不同。这种综合方法捕捉了复杂的模式和关系,从而增强了分类性能。此外,通过利用两个LDA标准,我们的方法通过利用更高维的特征空间优于LDA本身,这符合Cover定理,该定理有利于在更高维度上的线性可分性。此外,我们的方法阐明了复杂的DNN决策过程,使其在二维空间内变得易于理解。
发布时间: 10/10/2024
查看原文
作者: Jonathan Thomm, Aleksandar Terzic, Giacomo Camposampiero, Michael Hersche, Bernhard Sch\"olkopf, Abbas Rahimi
我们分析了Transformer语言模型在学习组合离散任务方面的能力。为此,我们在四个需要学习多个离散子任务组成的任务上评估了从头训练LLaMA模型以及提示GPT-4和Gemini。在从头训练LLaMA模型和提示GPT-4和Gemini时,我们都测量了这些模型能够多好地重用在子任务中可观察到的基本单元来学习组合任务。我们的结果表明,最先进的Transformer语言模型中的组合学习效率极低:LLaMA需要比从头重新学习所有子任务更多的样本才能学习组合任务;少量样本的上下文提示不可靠,并且无法执行子任务或纠正多轮代码生成中的错误。此外,我们利用复杂性理论,通过关注梯度下降在记忆前馈模型方面的样本效率低下的理论分析来支持这些发现。
发布时间: 10/10/2024
查看原文
作者: Alexandre Rio, Merwan Barlier, Igor Colin, Albert Thomas
我们解决了私有的深度离线强化学习(RL)问题,其目标是在标准控制任务上训练一个策略,该策略针对数据集中的单个轨迹是差分私有的(DP)。为此,我们引入了PriMORL,这是一种具有正式差分隐私保证的基于模型的RL算法。PriMORL首先从离线数据中学习环境的轨迹级DP模型的集合。然后,它在一个惩罚的私有模型上优化策略,而无需与系统进一步交互或访问数据集。除了提供强大的理论基础外,我们还通过实验证明,PriMORL能够在具有深度函数逼近的离线连续控制任务上训练私有RL智能体,而现有方法仅限于更简单的表格和线性马尔可夫决策过程(MDP)。此外,我们还概述了在这种情况下实现隐私所涉及的权衡。
发布时间: 10/10/2024
查看原文
作者: Hao Wang, Jinzhe Jiang, Xin Zhang, Chen Li
随着大型语言模型(LLM)在自然语言处理任务(NLP)中取得突破,多模态技术变得极其流行。然而,研究表明,多模态NLP容易受到对抗性攻击,模型的输出可以通过对输入的扰动而发生巨大变化。尽管在计算机视觉和NLP模型中都提出了一些防御技术,但模型的多模态鲁棒性尚未得到充分探索。本文研究了通过限制前K个softmax输出,修改预训练多模态模型损失函数所提供的对抗鲁棒性。基于评估和评分,我们的实验表明,经过微调后,预训练模型的对抗鲁棒性可以显著提高,能够抵抗常见的攻击。未来的研究方向包括:输出多样性、泛化能力以及此类损失函数的鲁棒性-性能权衡。本文被接收后,我们将公开代码。
发布时间: 10/10/2024
查看原文
作者: Zeeshan Patel, Karim El-Refai, Jonathan Pei, Tianle Li
基于动作引导的自动长篇故事生成:一种利用大型语言模型的双模型反馈方法。该方法将故事写作视为一个搜索问题,通过两个大型语言模型的反馈循环实现:一个模型生成故事内容,另一个辅助模型选择下一个最佳“动作”来引导故事未来的发展方向。结果表明,该方法在 GPT-4 和人工评估中均显著优于以往的端到端故事生成技术,并且仅使用小型开源模型的 SWAG 管道就超越了 GPT-3.5-Turbo。
发布时间: 10/10/2024
查看原文
作者: Junlin Wu, Jiongxiao Wang, Chaowei Xiao, Chenguang Wang, Ning Zhang, Yevgeniy Vorobeychik
从成对比较中学习奖励模型是许多领域(包括自主控制、对话代理和推荐系统)中的一个基本组成部分,其广泛目标是使自动化决策与用户偏好保持一致。这些方法需要收集人们的偏好信息,反馈通常是匿名提供的。由于偏好是主观的,因此没有黄金标准可以进行比较;然而,高影响力系统对偏好学习的依赖性,使得恶意行为者有很强的动机去歪曲以这种方式收集的数据以达到他们的目的。我们通过考虑一个可以翻转一小部分偏好比较以促进或降低目标结果的攻击者来调查这种漏洞的性质和程度。我们针对这些攻击提出了两类算法方法:一种基于梯度的方法和几种基于距离排序方法的变体。接下来,我们评估这两类最佳攻击在自主控制、推荐系统和文本提示响应偏好学习这三个领域的数据集中成功实现恶意目标的有效性。我们发现,最佳攻击通常非常成功,在最极端的情况下,只有0.3%的数据被污染就能达到100%的成功率。然而,哪个攻击是最好的,在不同领域之间差异很大。此外,我们观察到,更简单、更可扩展的基于距离排序的方法通常与基于梯度的方法具有竞争力,有时甚至显著优于后者。最后,我们表明,针对其他类型中毒攻击的最新防御措施在我们这种情况下效果有限。
发布时间: 10/10/2024
查看原文