LLM2D

arXiv 论文列表

作者: Zhi Zheng, Changliang Zhou, Tong Xialiang, Mingxuan Yuan, Zhenkun Wang
单阶段神经组合优化求解器在各种小规模组合优化(CO)问题上取得了接近最优的结果,无需专家知识。然而,这些求解器在应用于大规模CO问题时表现出明显的性能下降。最近,采用分治策略的两阶段神经方法在解决大规模CO问题方面展现出效率。然而,这些方法的性能高度依赖于分治过程中的特定问题启发式方法,这限制了它们对一般CO问题的适用性。此外,这些方法采用单独的训练方案,忽略了分治策略之间的相互依赖关系,这往往会导致次优解。为了解决这些缺点,本文开发了一个统一的神经分治框架(UDC)来解决一般的大规模CO问题。UDC提供了一种分治重组(DCR)训练方法,以消除次优分治策略的负面影响。通过采用高效的图神经网络(GNN)进行全局实例分治,以及采用固定长度子路径求解器来解决分治后的子问题,所提出的UDC框架展现出广泛的适用性,在10个代表性的大规模CO问题中取得了优异的性能。代码可在https://github.com/CIAM-Group/NCO_code/tree/main/single_objective/UDC-Large-scale-CO-master获取。
发布时间: 9/27/2024
查看原文
作者: Weixing Wang, Haojin Yang, Christoph Meinel
先前研究表明,演示可以显著帮助大型语言模型 (LLM) 在给定任务上取得更好的表现。然而,这种所谓的“上下文学习”(ICL) 能力对演示的上下文非常敏感,通常需要数十个演示。在这项工作中,我们研究了是否可以在保持竞争性能的同时减少演示次数。我们提出了 SeCoKD,这是一个自知识蒸馏 (KD) 训练框架,它将学生模型与一个经过大量提示的变体对齐,从而提高单一演示的利用率。我们在三个 LLM 和六个基准上对 SeCoKD 进行了实验,主要关注推理任务。结果表明,我们的方法优于基模型和监督微调 (SFT),尤其是在零样本和单样本设置中,分别提高了 30% 和 10%。此外,SeCoKD 在评估新任务时几乎没有负面影响,比监督微调更稳健。
发布时间: 9/27/2024
查看原文
作者: Adam D. Kypriadis, Isaac E. Lagaris, Aristidis Likas, Konstantinos E. Parsopoulos
求解常微分方程和偏微分方程的近似解是一个重大挑战。神经形式基于本质上依赖于神经网络的函数表达式,专门设计用于精确地满足问题的规定初始条件或边界条件,同时以封闭形式提供近似解。从重要的常微分方程类别出发,本工作旨在改进和验证神经形式方法,为在更具挑战性的领域中进一步发展奠定基础。主要贡献如下。首先,它介绍了一种形式化方法,用于系统地构建具有适应性边界匹配的适当神经形式,这些形式适合于优化。其次,它描述了一种将具有 Neumann 或 Robin 条件的问题转换为具有参数 Dirichlet 条件的等效问题的新技术。第三,它概述了一种确定与精确解的绝对偏差上限的方法。所提出的增强神经形式方法在一组不同的问题上进行了测试,包括一阶和二阶常微分方程,以及一阶系统。也考虑了刚性微分方程。所得解经评估与现有的精确解、通过常见惩罚神经方法推导出的解以及通过现代数值分析方法获得的解进行比较。报告的结果表明,增强的神经形式不仅可以精确地满足边界和初始条件,而且还可以提供封闭形式的解,这些解有助于高质量的插值和可控的整体精度。这些属性对于将神经形式的应用领域扩展到由偏微分方程描述的更具挑战性的问题至关重要。
发布时间: 9/27/2024
查看原文
作者: Robert Kasumba, Dom CP Marticorena, Anja Pahor, Geetha Ramani, Imani Goffney, Susanne M Jaeggi, Aaron Seitz, Jacob R Gardner, Dennis L Barbour
认知建模通常依赖于让参与者完成一系列不同的测试,以估计注意力、工作记忆和其他潜在变量。在许多情况下,这些测试会导致高度可变的观察模型。一种几乎普遍采用的方法是,对每个测试独立重复多次观察,从而得到每个测试在给定每个受试者的情况下结果的分布。如果采用潜在变量模型(LVM),则只有在数据收集之后才会添加。在本文中,我们探讨了使用 LVM 来同时跨多个相关变量进行学习。我们将 LVM 扩展到观察数据对于每个受试者来说是一系列来自许多不同分布的观察结果,而不是要重构的简单向量。通过将个体在潜在空间中的测试电池结果嵌入到一个跨人群联合训练的潜在空间中,我们可以利用单个参与者之间不同测试数据的相关性以及多个参与者之间的相关性。然后,我们提出一个主动学习框架,利用该模型来进行更有效的认知测试电池。我们通过使用实时数据采集来验证我们的方法,证明它在使用更少的测试项目进行项目级预测时,与传统方法相比具有可比性。
发布时间: 9/27/2024
查看原文
作者: Sen Yang, Xin Li, Leyang Cui, Lidong Bing, Wai Lam
大型语言模型 (LLMs) 已经取代了众多自然语言处理任务中的传统方法。然而,在命名实体识别 (NER) 中,现有的基于 LLMs 的方法...
发布时间: 9/27/2024
查看原文
作者: Sherry Yang, Yilun Du, Kamyar Ghasemipour, Jonathan Tompson, Leslie Kaelbling, Dale Schuurmans, Pieter Abbeel
在互联网数据上训练的生成模型彻底改变了文本、图像和视频内容的创建方式。也许生成模型的下一个里程碑是模拟对人类、机器人和其他交互式代理采取的行动做出反应的真实体验。现实世界模拟器的应用范围从游戏和电影中的可控内容创建,到纯粹在模拟中训练具身代理,这些代理可以直接部署到现实世界中。我们探索了通过生成式建模学习现实世界交互的通用模拟器(UniSim)的可能性。我们首先得出一个重要的观察结果,即用于学习现实世界模拟器的自然数据集通常在不同的维度上都很丰富(例如,图像数据中的丰富物体、机器人数据中的密集采样动作以及导航数据中的多样化运动)。通过仔细编排不同的数据集,每个数据集都提供了整体体验的不同方面,我们可以模拟从“打开抽屉”等高级指令到从其他静态场景和物体中获得的低级控制的视觉结果。我们使用该模拟器来训练高级视觉语言策略和低级强化学习策略,每种策略都可以在纯粹在模拟中训练后,在现实世界中零样本部署。我们还表明,其他类型的智能,例如视频字幕模型,可以从模拟体验训练中获益,从而开辟更广泛的应用。视频演示可以在 https://universal-simulator.github.io 找到。
发布时间: 9/27/2024
查看原文
作者: Xihuai Wang, Shao Zhang, Wenhao Zhang, Wentao Dong, Jingxiao Chen, Ying Wen, Weinan Zhang
零样本协作(ZSC)是一种新的多智能体强化学习(MARL)挑战,旨在训练一个自我代理,使其能够在部署期间与各种未见过的伙伴合作。部署时伙伴分布与训练算法确定的训练伙伴分布之间存在显著差异,这使得 ZSC 成为一种独特的分布外(OOD)泛化挑战。评估与部署时伙伴之间的潜在分布差距会导致评估不足,而缺乏合适的评估指标加剧了这种情况。在本文中,我们介绍了 ZSC-Eval,这是第一个针对 ZSC 算法的评估工具包和基准。ZSC-Eval 包含:1)通过行为偏好奖励生成评估伙伴候选者,以近似部署时伙伴的分布;2)通过最佳响应多样性(BR-Div)选择评估伙伴;3)通过最佳响应接近度(BR-Prox)指标,使用各种评估伙伴测量泛化性能。我们使用 ZSC-Eval 在 Overcooked 和 Google Research Football 环境中对 ZSC 算法进行基准测试,并获得了新的经验发现。我们还对当前的 ZSC 算法进行了人类实验,以验证 ZSC-Eval 与人类评估的一致性。ZSC-Eval 现已在 https://github.com/sjtu-marl/ZSC-Eval 上提供。
发布时间: 9/27/2024
查看原文
作者: Andrew Nam, Eric Elmoznino, Nikolay Malkin, James McClelland, Yoshua Bengio, Guillaume Lajoie
符号系统是强大的认知过程建模框架,因为它封装了人类推理和行为许多方面的基本规则和关系。系统性、组合性和生产力是这些模型的核心,使它们在认知科学和人工智能领域都具有不可估量的价值。然而,仍然存在一些局限性。例如,结构化符号过程和潜在亚符号过程的集成在计算层面上通过量化或 softmax 采样等专断方法实现,这些方法假设而不是推导出离散化和符号化的基础操作。在这项工作中,我们介绍了一种新颖的神经随机动力系统模型,该模型将吸引子动力学与符号表示相结合,以模拟类似于概率语言思想 (PLoT) 的认知过程。我们的模型将连续的表示空间分割成离散的盆地,吸引子状态对应于符号序列,这些序列通过无监督学习反映了符号系统的语义性和组合性,而不是依赖于预定义的基元。此外,与 PLoT 一样,我们的模型学习对反映输入数据和符号编码之间互信息的吸引子状态的多种分布进行采样。这种方法建立了一个统一的框架,通过神经动力学集成符号和亚符号处理,神经动力学是一种在人工智能中具有证明的表达能力的神经可信基质,提供了一个更全面的模型,反映了认知操作的复杂二元性。
发布时间: 9/27/2024
查看原文
作者: Thibault Monsel (DATAFLOT, TAU), Onofrio Semeraro (DATAFLOT), Lionel Mathelin (DATAFLOT), Guillaume Charpiat (TAU)
在从物理和工程到医学和经济学的大量问题中,其控制方程中会出现不连续性和延迟项。这些系统无法用标准的常微分方程 (ODE) 或数据驱动的近似方法(如神经常微分方程 (NODE))进行适当的建模和模拟。为了解决这个问题,通常引入潜在变量,在更高维空间中求解系统的动力学,并将解投影到原始空间。然而,这种解缺乏物理可解释性。相比之下,延迟微分方程 (DDE) 及其数据驱动的近似对应物,自然成为表征此类系统的良好候选者。在这项工作中,我们重新审视了最近提出的神经 DDE,通过引入神经状态相关 DDE (SDDDE),这是一个通用且灵活的框架,可以模拟多个与状态和时间相关的延迟。我们证明了我们的方法具有竞争力,并且在各种延迟动力系统上优于其他连续类模型。代码可在以下存储库中获取:\href{https://github.com/thibmonsel/Time-and-State-Dependent-Neural-Delay-Differential-Equations}{此处}。
发布时间: 9/27/2024
查看原文
作者: Tao Chen, Liang Lv, Di Wang, Jing Zhang, Yue Yang, Zeyang Zhao, Chen Wang, Xiaowei Guo, Hao Chen, Qingye Wang, Yufei Xu, Qiming Zhang, Bo Du, Liangpei Zhang, Dacheng Tao
随着世界人口的快速增长,将我们的农业食品系统转变为更加高效、安全和可持续的系统,对于缓解潜在的粮食短缺至关重要。近年来,人工智能(AI)技术,如深度学习(DL),在语言、视觉、遥感(RS)和农业食品系统应用等各个领域都展现出强大的能力。然而,AI 对农业食品系统的总体影响仍不清楚。本文全面回顾了 AI 技术如何改变农业食品系统并为现代农业食品行业做出贡献。首先,我们总结了农业食品系统中的数据获取方法,包括获取、存储和处理技术。其次,我们对农业食品系统中 AI 方法的进展进行了回顾,特别是在农业、畜牧业和渔业方面,涵盖了农业食品分类、生长监测、产量预测和质量评估等主题。此外,我们还强调了利用 AI 转型现代农业食品系统的潜在挑战和有希望的研究机会。我们希望本调查能够为该领域的初学者提供一个整体的概览,并作为他们进一步研究的起点。项目网站为 https://github.com/Frenkie14/Agrifood-Survey。
发布时间: 9/27/2024
查看原文