LLM2D

arXiv 论文列表

作者: Zhenbiao Cao, Yuanlei Zheng, Zhihao Fan, Xiaojin Zhang, Wei Chen, Xiang Bai
文本到SQL生成旨在将自然语言问题转换为SQL语句。在大语言模型(LLM)驱动的文本到SQL系统中,模式链接是一种广泛采用的策略,它通过仅选择相关的模式元素来简化LLM的输入,从而减少噪声和计算开销。然而,模式链接面临着需要谨慎对待的风险,包括可能遗漏必要的元素以及破坏数据库结构完整性。为了应对这些挑战,我们提出了一种名为RSL-SQL的新颖框架,它结合了双向模式链接、上下文信息增强、二元选择策略和多轮自我校正。我们使用前向和后向剪枝方法提高了模式链接的召回率,在减少83%的输入列数量的同时,实现了94%的严格召回率。此外,它通过在增强了上下文信息的完整模式和简化模式之间进行投票来规避风险。在BIRD和Spider基准测试上的实验表明,我们的方法在开源解决方案中实现了最先进的执行精度,在BIRD上达到67.2%,在Spider上达到87.9%(使用GPT-4o)。此外,在采用DeepSeek(成本更低)且提示词不变的情况下,我们的方法优于一系列基于GPT-4的文本到SQL系统。大量的分析和消融研究证实了我们框架中每个组件的有效性。代码可在https://github.com/Laqcce-cao/RSL-SQL获取。
发布时间: 11/27/2024
查看原文
作者: Xinpeng Wang, Yongxin Guo, Xiaoying Tang
领域泛化 (DG) 旨在训练能够有效泛化到未见领域的模型。然而,在联邦学习 (FL) 的背景下,客户端协作训练模型而无需直接共享其数据,大多数现有的 DG 算法由于隐私限制以及每个客户端有限的数据量和领域多样性而无法直接应用于 FL 设置。为了应对这些挑战,我们提出了 FedCCRL,这是一种轻量级的联邦领域泛化方法,它在保护隐私并确保计算和通信效率的同时,显著提高了模型的泛化能力。具体而言,FedCCRL 包含两个主要模块:第一个是跨客户端特征扩展模块,它通过跨客户端领域迁移和领域不变特征扰动来增加局部领域多样性;第二个是表示和预测双阶段对齐模块,它使模型能够有效地捕获领域不变特征。大量的实验结果表明,FedCCRL 在 PACS、OfficeHome 和 miniDomainNet 数据集上,在不同客户端数量的 FL 设置下都取得了最先进的性能。代码可在 https://github.com/sanphouwang/fedccrl 获取。
发布时间: 11/27/2024
查看原文
深度强化学习智能体在广泛的模拟控制任务中取得了最先进的性能。然而,其在现实世界问题的成功应用仍然有限。这种差异的一个原因是学习到的策略对观测噪声或对抗性攻击不鲁棒。本文研究了深度强化学习策略在确定性连续控制任务中对单个小状态扰动的鲁棒性。我们证明了强化学习策略可能是确定性混沌的,因为系统状态的微小扰动会对后续状态和奖励轨迹产生重大影响。这种不稳定的非线性行为有两个后果:首先,传感器读数的不准确或对抗性攻击会导致性能显著下降;其次,即使在奖励方面表现出鲁棒性能的策略也可能在实践中表现出不可预测的行为。强化学习策略中混沌的这两个方面极大地限制了深度强化学习在现实世界问题的应用。为了解决这个问题,我们对成功的 Dreamer V3 架构进行了改进,实现了最大李雅普诺夫指数正则化。这种新方法减少了混沌状态动力学,使学习到的策略更能抵抗传感器噪声或对抗性攻击,从而提高了深度强化学习适用于现实世界应用的适用性。
发布时间: 11/27/2024
查看原文
作者: Shenao Zhang, Zhihan Liu, Zhaoran Wang
大型语言模型 (LLM) 中的偏好对齐显著提高了其遵守人类指令和意图的能力。然而,现有的直接对齐算法主要关注相对偏好,往往忽略了响应的质性方面。努力最大化所选响应和略逊一筹的被拒绝响应之间的隐含奖励差距可能导致过拟合,并导致不必要地遗忘高质量的被拒绝响应。对奖励分数的不知情也驱动 LLM 不加区分地偏好低质量的所选响应,并且无法泛化到具有最高奖励(在数据中稀疏)的响应。为了克服这些缺点,我们的研究引入了奖励条件的 LLM 策略,这些策略能够识别并学习数据集中响应质量的整个范围,从而帮助推断到更优区域。我们提出了一种有效且简单的数据重新标记方法,该方法根据质量分数对偏好对进行条件化,以构建奖励增强的数据集。该数据集易于与现有的直接对齐算法集成,并适用于任何偏好数据集。在包括 AlpacaEval、MT-Bench 和 Arena-Hard-Auto 在内的指令遵循基准测试中的实验结果表明,我们的方法在各种模型上始终如一地大幅提高了 DPO 的性能。此外,我们的方法提高了各种学术基准测试的平均准确率。当将我们的方法应用于策略内数据时,生成的 DPO 模型在 AlpacaEval 上取得了最先进的结果。通过消融研究,我们证明了我们的方法不仅最大限度地利用了偏好数据,而且还减轻了遗忘问题,证明了其超越单纯数据集扩展的广泛有效性。我们的代码可在 https://github.com/shenao-zhang/reward-augmented-preference 获取。
发布时间: 11/27/2024
查看原文
作者: Barak Gahtan, Robert J. Shahla, Alex M. Bronstein, Reuven Cohen
QUIC 协议已被越来越多地采用,它通过提供改进的安全性和性能以及流多路复用和连接迁移等功能来解决 TCP 的局限性。然而,这些增强功能也给网络运营商带来了监控和分析网络流量的挑战,尤其是在 QUIC 的加密特性方面。现有的数据集存在不足,它们往往过时、缺乏多样性、对关键信息进行匿名化处理,或排除诸如 SSL 密钥之类的基本特征——这限制了该领域的全面研究和开发。我们引入了 VisQUIC,这是一个公开可用的数据集,包含超过 100,000 条带有相应 SSL 密钥的已标记 QUIC 跟踪记录,这些记录在四个月内从超过 40,000 个网站收集而来。通过生成跟踪记录的可视化表示,我们促进了高级机器学习 (ML) 应用和对加密 QUIC 流量的深入分析。为了证明该数据集的潜力,我们仅使用加密流量就估计了 QUIC 连接中 HTTP3 请求-响应对的数量,准确率高达 92%。此估计结果提供了对服务器行为、客户端-服务器交互和连接负载的洞察——这对于负载平衡和入侵检测等任务至关重要。我们的数据集能够对 QUIC 和 HTTP/3 协议进行全面研究,并支持开发用于加密流量分析的工具。
发布时间: 11/27/2024
查看原文
作者: Kailai Feng, Yabo Zhang, Haodong Yu, Zhilong Ji, Jinfeng Bai, Hongzhi Zhang, Wangmeng Zuo
艺术排版是一种以可想象和可读的方式可视化输入字符含义的技术。现有的方法利用强大的文本到图像扩散模型直接设计输入字符的整体几何形状和纹理,这使得同时保证创造性和可读性具有挑战性。本文介绍了一种双分支、免训练的方法,即 VitaGlyph,它能够实现灵活的艺术排版以及可控的几何形状变化以保持可读性。VitaGlyph 的关键在于将输入字符视为由主体和周围环境组成的场景,然后在不同程度的几何变换下渲染它们。主体灵活地表达输入字符的基本概念,而周围环境则丰富相关的背景而不改变形状。具体来说,我们通过三阶段框架实现 VitaGlyph:(i)知识获取利用大型语言模型设计主体和周围环境的文本描述;(ii)区域分解检测最匹配主体描述的部分,并将输入字形图像划分为主体和周围区域;(iii)排版风格化首先通过语义排版细化主体区域的结构,然后通过可控组合生成分别渲染主体和周围区域的纹理。实验结果表明,VitaGlyph 不仅实现了更好的艺术性和可读性,而且能够描绘多种自定义概念,从而促进更具创意和美感的艺术排版生成。我们的代码将公开发布在 https://github.com/Carlofkl/VitaGlyph。
发布时间: 11/27/2024
查看原文
作者: Pablo Bernabeu-Perez, Enrique Lopez-Cuena, Dario Garcia-Gasulla
随着越来越逼真的图像生成模型不断发布,对合成图像检测器的需求也日益增长。为了构建有效的检测器,我们必须首先了解数据源多样性、训练方法和图像修改等因素如何影响其泛化能力。本研究进行了系统的分析,并利用其见解制定了训练鲁棒合成图像检测器的实用指南。模型的泛化能力在不同的设置(例如,规模、来源、变换)下进行了评估,包括真实世界的部署条件。通过对各种最新数据集上最先进检测器的广泛基准测试,我们发现,虽然现有方法在特定场景中表现出色,但没有单个检测器能够实现普遍的有效性。我们确定了检测器中的关键缺陷,并提出了解决方法,以实现真实世界检测器应用程序的部署,从而提高准确性、可靠性和鲁棒性,克服现有系统的局限性。
发布时间: 11/27/2024
查看原文
作者: Davide Buffelli, Farzin Soleymani, Bastian Rieck
图神经网络已成为从业者在图学习任务(如图分类和节点分类)中的默认选择。然而,流行的图神经网络模型仍然难以捕捉高阶信息,即超越成对交互的信息。最近的研究表明,持久同调(一种来自拓扑数据分析的工具)可以使图神经网络丰富它们原本无法捕捉到的拓扑信息。对于维度0(连通分量)和维度1(循环),计算这些特征是高效的。然而,当涉及到高阶结构时,它的扩展性不好,复杂度为O(n^d),其中n是节点数,d是结构的阶数。在这项工作中,我们介绍了一种新方法,该方法在仍然使用高效的低维持久同调算法的同时,提取图中高阶结构的信息。在标准基准数据集上,我们表明我们的方法可以使测试精度提高高达31%。
发布时间: 11/27/2024
查看原文
作者: Alexei Pisacane, Victor-Alexandru Darvariu, Mirco Musolesi
图路径搜索是计算机科学中的一个经典问题,近年来由于其超越现有方法的潜力而被强化学习 (RL) 重新关注。现有的 RL 技术通常假设对网络具有全局视野,这并不适用于大型、动态和隐私敏感的设置。社会网络中的搜索是一个特别令人关注的领域,因为它具有众多应用。受实验社会学开创性工作的启发,该工作表明在社会网络中可以实现去中心化但高效的搜索,我们将该问题构建为配备有限局部网络视图的多个代理之间的协作任务。我们提出了一种用于图路径搜索的多代理方法,该方法成功地利用了同质性和结构异质性。我们在合成和真实世界社交网络上进行的实验表明,我们的模型明显优于学习和启发式基线。此外,我们的结果表明,可以使用奖励驱动的学习构建用于图导航的有意义的嵌入。
发布时间: 11/27/2024
查看原文
作者: Anushka Swarup, Avanti Bhandarkar, Olivia P. Dizon-Paradis, Ronald Wilson, Damon L. Woodard
关系抽取是旨在从文本数据中提取关系的自然语言处理任务,它是信息抽取的关键步骤。由于其广泛的适用性,关系抽取研究已迅速扩展到使用高度先进的神经网络。尽管具有计算优势,但现代关系抽取器无法处理复杂的抽取场景。然而,文献中缺乏对汇编这些挑战的最新抽取器的全面性能分析,本文旨在弥补这一差距。目标是研究可能阻碍神经关系抽取的数据中心特征。这项研究基于使用15种最先进的关系抽取算法(从循环架构到大型语言模型)和七个大型数据集进行的大量实验,表明现代关系抽取器对复杂的数据和关系特征并不鲁棒。它强调了关键问题,例如上下文歧义、相关关系、长尾数据和细粒度关系分布。此外,它为缓解这些问题的未来方向设定了标记,从而成为新手和高级研究人员的重要资源。有效处理所描述的挑战,可以对信息抽取领域产生重大影响,信息抽取是搜索引擎和聊天机器人等流行系统的关键组成部分。数据和相关代码可在\url{https://aaig.ece.ufl.edu/projects/relation-extraction}找到。
发布时间: 11/27/2024
查看原文