LLM2D

arXiv 论文列表

作者: Hyunmin Cheong, Mohammadmehdi Ataei, Amir Hosein Khasahmadi, Pradeep Kumar Jayaraman
arXiv:2502.02628v1 宣告类型:交叉 摘要:深度生成模型在解决需要模型预测满足输入指定设计要求的复杂工程设计问题方面已显示出成功。然而,这类模型在有效设计探索方面仍面临挑战。对于许多设计问题,找到满足所有要求的解决方案往往是不可行的。在这种情况下,工程师们更倾向于获得与这些要求相关的帕累托最优解集,但均匀采样生成模型可能无法产生有用的目标集。为了解决这一差距,我们引入了一个新的框架,将仿真的微调生成模型用于帕累托前沿设计探索。首先,该框架采用为大型语言模型(LLMs)开发的偏好对齐方法,并展示了在工程设计中微调生成模型的首个应用。这里的重要区别在于我们使用模拟器而不是人类来提供准确和可扩展的反馈。接下来,我们提出了一种基于epsilon约束方法的epsilon采样,该方法用于经典优化算法生成帕累托前沿,以此使用微调后的模型构建高质量的帕累托前沿。我们的框架命名为e-SimFT,被证明比现有的多目标对齐方法生成更好的帕累托前沿。
发布时间: 2/6/2025
查看原文
作者: German Martinez Matilla, Jakub Marecek
arXiv:2502.02623v1 宣告类型: cross 摘要: 偏差估计的样本复杂性是任何偏差检测方法所需运行时间的下界。许多监管框架要求对所有亚组进行偏差测试,而亚组的数量随着保护属性数量的指数增长。除非希望以双指数运行时间进行偏差检测,否则应该希望单个亚组的偏差检测具有多项式复杂性。同时,参考数据可能基于调查,因此带有不可忽视的不确定性。在这里,我们将偏差检测重新表述为度量空间上的点到超平面问题,并表明对于 supremum 范数,它可以高效地进行子采样。特别是,我们的概率近似正确(PAC)结果通过著名的实例测试得到验证。
发布时间: 2/6/2025
查看原文
作者: F. Xavier Gaya-Morey, Jose M. Buades-Rubio, Philippe Palanque, Raquel Lacuesta, Cristina Manresa-Yee
arXiv:2502.02618v1 类型: cross 摘要:全球人口快速老龄化凸显了需要技术支持以辅助老年人,尤其是在医疗保健和情绪健康方面。面部表情识别(FER)系统为监测情绪状态提供了一种非侵入性方法,应用于辅助生活、心理健康支持和个人化护理。本研究对基于深度学习的FER系统进行了系统综述,重点关注其在老年人群体中的应用。我们采用了严格的分析方法,对过去十年中发表的31项研究进行了分析,解决了诸如针对老年人的特定数据集稀缺、类别不平衡以及随着年龄变化的面部表情差异的影响等问题。研究发现,卷积神经网络在FER中仍然占据主导地位,特别是对于资源受限环境中的轻量级版本。然而,现有的数据集通常在年龄表示的多样性方面存在不足,实际部署仍然受到限制。此外,隐私问题和需要可解释的人工智能技术成为采用的主要障碍。本综述强调了开发年龄包容性数据集、集成多模态解决方案以及采用可解释人工智能(XAI)技术以提高系统可用性、可靠性和可信度的重要性。我们最后提出了对未来研究的建议,旨在弥合学术进展与老年人护理的实际实施之间的差距。
发布时间: 2/6/2025
查看原文
作者: Insu Han, Praneeth Kacham, Amin Karbasi, Vahab Mirrokni, Amir Zandieh
arXiv:2502.02617v1 宣布类型: cross 摘要:大型语言模型(LLMs)在对其键值(KV)嵌入进行键值(KV)缓存时需要大量的内存,特别是在处理长距离上下文时。对这些KV嵌入进行量化是减少内存消耗的一种常见技术。本文介绍了一种新颖的量化方法PolarQuant,该方法结合了随机预处理和极坐标变换。我们的方法使用一种高效的递归算法将KV嵌入转换为极坐标,并然后对结果的角度进行量化。我们的核心见解是,在进行随机预处理后,极坐标表示中的角度具有紧密限定且高度集中的分布,并且其形式可以通过解析计算得出。这种良好的分布消除了传统的量化方法所需要的显式规范化步骤,这一步骤由于量化参数(例如零点和缩放因子)在每个数据块中需要以全精度存储,因此会带来显著的内存开销。PolarQuant避开了这一规范化步骤,从而实现了显著的内存节省。长上下文评估表明,PolarQuant在压缩KV缓存方面超过x4.2倍,同时在质量分数上超过最新方法。
发布时间: 2/6/2025
查看原文
arXiv:2502.02593v1 Announce Type: cross 摘要:流体流动是一个广泛应用于各种领域的物理问题。由于流体具有高度非线性和混沌的性质,分析流体相关问题极具挑战性。计算流体动力学(CFD)是进行这种分析的最佳工具,但在涉及大量计算资源的情况下,尤其是对于3D模拟,计算成本和资源消耗都非常大。在实验流体动力学中,PIV的成本随着维度的增加而增加。从2D PIV数据中重建3D流场可以降低成本并扩大应用场景。在这里,我们提出了一种基于扩散变换器的方法,用于从2D流数据中重建3D流场。通过将2D平面的位置信息嵌入到模型中,我们使得可以从任意2D切片的任何组合中重建3D流场,增强了灵活性。我们用窗口和平面注意力替换全局注意力,以在不牺牲性能的情况下降低高维度相关的计算成本。我们的实验表明,我们的模型能够高效且准确地从2D数据中重建3D流场,产生逼真的结果。
发布时间: 2/6/2025
查看原文
作者: Ran Xin, Chenguang Xi, Jie Yang, Feng Chen, Hang Wu, Xia Xiao, Yifan Sun, Shen Zheng, Kai Shen
arXiv:2502.03438v1 报告类型: 新颖 摘要: 近期大型语言模型(LLMs)的进步激发了使用Lean4进行自动定理证明的研究兴趣,在这种研究中,有效的树搜索方法对于导航证明搜索空间至关重要。尽管现有的方法主要依赖于值函数和蒙特卡洛树搜索(MCTS),但简单的如最佳优先搜索(BFS)的方法潜力仍未得到充分探索。本文研究了BFS是否可以在大规模定理证明任务中实现竞争力的性能。我们介绍了BFS-Prover,这是一种可扩展的专家迭代框架,具备三个关键创新。首先,我们实施了在每次专家迭代轮次中进行战略数据筛选,排除可以通过束搜索节点扩展解决的问题,以专注于更难的情况。其次,我们通过直接偏好优化(DPO)对自动注释有编译器错误反馈的状态-定理对进行采样效率的改进,使LLM的策略优先考虑有成效的扩展。第三,我们在BFS中采用长度归一化,鼓励探索更深层的证明路径。BFS-Prover在MiniF2F测试集上获得了71.31的得分,从而挑战了复杂树搜索方法的必要性,证明了当适当扩展时,BFS可以实现竞争力的性能。
发布时间: 2/6/2025
查看原文
作者: Zhenghao Peng, Wenjie Mo, Chenda Duan, Quanyi Li, Bolei Zhou
arXiv:2502.03369v1 公告类型: 新 摘要: 通过活跃的人类参与学习使人类主体能够在培训过程中积极介入并演示给AI代理。从人类那里获得的交互和纠正反馈为学习过程带来了安全性和AI对齐。在本文中,我们提出了一种新的无奖励主动人类参与方法,称为代理价值传播,用于策略优化。我们的关键见解是,可以设计一个代理价值函数来表达人类的意图,在人类演示中的状态-动作对被标记为高值,而被干预的代理动作则被标记为低值。通过TD学习框架,演示的状态-动作对的标记值可以进一步传播到从代理探索生成的未标记数据中。因此,代理价值函数诱导出一个策略,该策略忠实于人类行为。通过循环的人类实验,展示了我们方法的通用性和高效性。通过对现有强化学习算法进行最小修改,我们的方法能够使用各种人类控制设备学习解决连续和离散的控制任务,包括在《侠盗猎车手V》中驾驶的具有挑战性的任务。视频演示和代码可在以下网址获取:https://metadriverse.github.io/pvp
发布时间: 2/6/2025
查看原文
作者: Chunwei Liu, Gerardo Vitagliano, Brandon Rose, Matt Prinz, David Andrew Samson, Michael Cafarella
arXiv:2502.03368v1 宣告类型: 新 摘要: 由于生成架构和大型语言模型的进步,数据科学家现在可以编写机器学习操作的管道来处理大量未结构化数据。最近的进步见证了声明式AI框架(例如Palimpzest、Lotus和DocETL)的兴起,用于构建优化且日益复杂的管道,但这些系统往往仍然仅对专家程序员开放。在这次演示中,我们介绍了PalimpChat,这是一种基于聊天的接口,通过Palimpzest及其关系和基于LLM的操作,该接口通过自然语言让用户创建和运行复杂的AI管道,从而弥合了这一差距。通过集成Archytas(一种基于ReAct的推理代理)和Palimpzest的系列操作,PalimpChat提供了一种实用的示例,说明了聊天界面如何让声明式AI框架真正对非专家用户开放。 我们的演示系统已经在线公开。在SIGMOD'25中,参与者可以探索三个实际场景——科学发现、法律发现和房地产搜索——或在自己的数据集上应用PalimpChat。在这篇论文中,我们重点介绍了PalimpChat在Palimpzest优化器支持下如何简化提取和分析生物医学数据等复杂AI工作流程。
发布时间: 2/6/2025
查看原文
作者: Ben Liu, Jihai Zhang, Fangquan Lin, Cheng Yang, Min Peng, Wotao Yin
arXiv:2502.03283v1 宣告类型: 新 摘要: 最近的发展表明,当解决复杂推理问题时,大型语言模型(LLMs)容易产生幻觉,导致错误的结果。为了应对这一问题,研究者们将知识图谱(KGs)纳入进来,以提高LLMs的推理能力。然而,现有的方法面临两个限制:1) 他们通常假设所有问题的答案都包含在KGs中,忽视了KGs的不完备性问题;2) 他们将KGs视为静态存储库,并忽略了KGs内在的隐式逻辑推理结构。在这篇论文中,我们引入了SymAgent,这是一种创新的神经符号代理框架,实现了KGs和LLMs之间的协作增强。我们将KGs概念化为动态环境,并将复杂的推理任务转化为多步互动过程,使KGs能够积极参与推理过程。SymAgent由两个模块组成:Agent-Planner和Agent-Executor。Agent-Planner利用LLM的归纳推理能力从KGs中提取符号规则,指导有效的问题分解。Agent-Executor自主调用预定义的操作工具,从KGs和外部文档中整合信息,解决KGs不完备性的问题。此外,我们设计了一个自我学习框架,包括在线探索和离线迭代策略更新阶段,使代理能够自动综合推理轨迹并提高性能。实验结果表明,使用较弱的LLM底座(例如7B系列)的SymAgent在各种强基线方法中表现更好或相当。进一步的分析表明,我们的代理能够识别缺失的三元组,促进了自动KG更新。
发布时间: 2/6/2025
查看原文
作者: Vasileios Manginas, Nikolaos Manginas, Edward Stevinson, Sherwin Varghese, Nikos Katzouris, Georgios Paliouras, Alessio Lomuscio
arXiv:2502.03274v1 通知类型: 新 摘要: 神经-符号人工智能(NeSy AI)已经成为了将神经学习与符号推理相结合的一个有前途的方向。在这样的系统的一种概率性变体中,一个神经网络首先从亚符号输入中提取一组符号,然后这些符号被符号组件用于以概率性的方式进行推理以回答查询。在本文中,我们解决了正式验证此类NeSy概率性推理系统的鲁棒性的问题,从而为它们在关键领域中的安全部署铺平了道路。我们分析了解决这个问题的复杂性,表明它是$\mathrm{NP}^{\# \mathrm{P}}$-hard。为了克服这一问题,我们提出了第一个基于近似和松弛的NeSy概率性系统验证方法。实验结果表明,所提出的方法在可扩展性上远优于基于求解器的方法,并将我们的技术应用于一个实际的自动驾驶数据集,在此数据集中,我们验证了在大输入维度和网络规模下的安全性属性。
发布时间: 2/6/2025
查看原文