LLM2D

arXiv 论文列表

作者: Gleb Bazhenov, Oleg Platonov, Liudmila Prokhorenkova
表格机器学习是工业和科学领域的重要领域。在该领域,表格行通常被视为独立的数据样本,但有时会提供有关它们之间关系的附加信息,这些信息可用于提高预测性能。这种信息可以用图自然地建模,因此表格机器学习可以从图机器学习方法中受益。然而,图机器学习模型通常在具有同质节点特征的数据集上进行评估,这些特征与表格数据集中存在的数值和类别特征的异质混合物几乎没有共同点。因此,表格和图机器学习研究中使用的数据之间存在关键差异,这无法让人了解图模型可以成功地转移到表格数据中的程度。为了弥合这一差距,我们提出了一种新的基准,其中包含具有异质表格节点特征和现实预测任务的各种图。我们使用此基准评估了大量模型,包括文献中以前被忽视的简单方法。我们的实验表明,图神经网络(GNN)确实可以经常为表格数据带来预测性能的提升,但标准表格模型也可以通过使用简单的特征预处理来适应图数据,这有时使它们能够与 GNN 竞争,甚至胜过 GNN。根据我们的实证研究,我们为表格和图机器学习领域的科研人员和从业者提供了见解。
发布时间: 9/27/2024
查看原文
作者: Michael D. Skarlinski, Sam Cox, Jon M. Laurent, James D. Braza, Michaela Hinks, Michael J. Hammerling, Manvitha Ponnapati, Samuel G. Rodriques, Andrew D. White
大型语言模型以其在众多自然语言处理任务中取代传统方法的能力而闻名。然而,在命名实体识别(NER)中,现有的基于大型语言模型的方法...
发布时间: 9/27/2024
查看原文
作者: Lei Liang, Mengshu Sun, Zhengke Gui, Zhongshu Zhu, Zhouyu Jiang, Ling Zhong, Yuan Qu, Peilong Zhao, Zhongpu Bo, Jin Yang, Huaidong Xiong, Lin Yuan, Jun Xu, Zaoyang Wang, Zhiqiang Zhang, Wen Zhang, Huajun Chen, Wenguang Chen, Jun Zhou
近年来发展起来的检索增强生成(RAG)技术,为构建特定领域的应用提供了高效的途径。然而,它也存在一些局限性,包括向量相似度与知识推理的相关性之间的差距,以及对知识逻辑的敏感性不足,例如数值、时间关系、专家规则等,这些都阻碍了专业知识服务的有效性。在这项工作中,我们介绍了一种名为知识增强生成(KAG)的专业领域知识服务框架。KAG旨在解决上述挑战,其目标是充分利用知识图谱(KG)和向量检索的优势,通过五个关键方面双向增强大型语言模型(LLM)和KG,从而提高生成和推理性能:(1)LLM友好的知识表示,(2)知识图谱与原始片段之间的互索引,(3)逻辑形式引导的混合推理引擎,(4)知识与语义推理的对齐,以及(5)KAG模型能力增强。我们比较了KAG与现有的RAG方法在多跳问答中的表现,发现它显著优于最先进的方法,在F1得分方面,在2wiki上相对提高了19.6%,在hotpotQA上相对提高了33.5%。我们已成功将KAG应用于蚂蚁集团的两个专业知识问答任务,包括电子政务问答和电子健康问答,与RAG方法相比,在专业性方面取得了显著进步。
发布时间: 9/27/2024
查看原文
作者: Yuxin Zhang, Zheng Lin, Zhe Chen, Zihan Fang, Wenjun Zhu, Xianhao Chen, Jin Zhao, Yue Gao
传统的联邦学习(FL)框架严重依赖陆地网络,而覆盖范围限制和日益严重的带宽拥堵严重阻碍了模型收敛。幸运的是,低地球轨道(LEO)卫星网络的进步为增强传统陆地 FL 提供了有希望的新通信途径。尽管存在这种潜力,但有限的卫星地面通信带宽以及地面设备异构运行环境(包括数据、带宽和计算能力的变化)对有效和稳健的卫星辅助 FL 构成了重大挑战。为了应对这些挑战,我们提出了 SatFed,这是一个资源高效的卫星辅助异构 FL 框架。SatFed 实施了基于新鲜度的模型优先级队列,以优化对高度受限的卫星地面带宽的使用,确保传输最关键的模型。此外,构建了一个多图来捕获设备之间的实时异构关系,包括数据分布、陆地带宽和计算能力。这种多图使 SatFed 能够将卫星传输的模型聚合到同行指导中,从而增强异构环境中的本地训练。使用真实世界 LEO 卫星网络进行的大量实验表明,与最先进的基准相比,SatFed 实现了卓越的性能和鲁棒性。
发布时间: 9/27/2024
查看原文
作者: Alexandru Vasilache, Jann Krausse, Klaus Knobloch, Juergen Becker
皮质内脑机接口 (iBMIs) 有潜力通过恢复瘫痪人士执行日常活动的能力,极大地改善他们的生活。然而,由于笨重的硬件和布线,目前的 iBMIs 存在可扩展性和移动性方面的局限性。无线 iBMIs 提供了一种解决方案,但受到有限数据速率的限制。为了克服这一挑战,我们正在研究用于无线 iBMIs 中嵌入式神经解码的混合脉冲神经网络。该网络由基于时间卷积的压缩、循环处理以及最终插值回原始序列长度组成。作为循环单元,我们探索了门控循环单元 (GRUs)、泄漏积分与激发 (LIF) 神经元以及两者的组合——脉冲 GRUs (sGRUs),并分析了它们在准确性、占用空间和激活稀疏性方面的差异。为此,我们在“多通道感觉运动皮层脑电图记录的非人灵长类动物伸手运动”数据集上训练解码器,并使用 NeuroBench 框架对其进行评估,目标是 IEEE BioCAS 神经解码大挑战的两个赛道。我们的方法在从多通道初级运动皮层记录中预测灵长类动物伸手运动速度方面取得了高精度,同时保持了较低的突触操作数量,超越了 NeuroBench 框架中的当前基线模型。这项工作突出了混合神经网络在促进无线 iBMIs 方面取得高解码精度和大幅增加监测神经元数量的潜力,为更先进的神经假体技术铺平了道路。
发布时间: 9/27/2024
查看原文
作者: Ziyu Tang, Weicai Ye, Yifan Wang, Di Huang, Hujun Bao, Tong He, Guofeng Zhang
基于体积渲染的神经隐式重建方法在恢复密集的三维表面方面表现出有效性。然而,同时恢复精细的几何形状并在具有不同特征的区域之间保持平滑性并非易事。为了解决这个问题,以往的方法通常采用几何先验,而这些先验模型的性能往往限制了其应用。本文提出了一种新的方法 ND-SDF,该方法学习一个法线偏转场来表示场景法线与先验法线之间的角度偏差。与以往在所有样本上统一应用几何先验的方法不同,我们的法线偏转场能够根据样本的特定特征动态地学习和调整样本的利用率,从而提高模型的准确性和有效性。我们的方法不仅能够获得光滑的弱纹理区域(如墙壁和地板),而且能够保留复杂结构的几何细节。此外,我们还提出了一种基于偏转角的新型射线采样策略,以促进无偏渲染过程,显著提高了复杂表面的质量和精度,尤其是在薄结构上。在各种具有挑战性的数据集上的一致改进证明了我们方法的优越性。
发布时间: 9/27/2024
查看原文
作者: Xingyou Song, Qiuyi Zhang, Chansoo Lee, Emily Fertig, Tzu-Kuo Huang, Lior Belenki, Greg Kochanski, Setareh Ariafar, Srinivas Vasudevan, Sagi Perel, Daniel Golovin
谷歌 Vizier 已经执行了数百万次优化,加速了谷歌的众多研究和生产系统,证明了贝叶斯优化作为一项大规模服务的成功。多年来,其算法通过众多研究成果和用户反馈的集体经验得到了显著改进。在本技术报告中,我们讨论了开源 Vizier 提供的当前默认算法的实现细节和设计选择。我们在标准化基准上的实验揭示了其在多种实际模式下对行业公认基准的鲁棒性和多功能性。
发布时间: 9/27/2024
查看原文
作者: Yuhong Deng, David Hsu
大型语言模型 (LLM) 已经在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别 (NER) 中,现有的基于 LLM 的方法...
发布时间: 9/27/2024
查看原文
作者: Ziyuan Zhuang, Zhiyang Zhang, Sitao Cheng, Fangkai Yang, Jia Liu, Shujian Huang, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Qi Zhang
检索增强生成(RAG)方法在处理复杂问题(如多跳查询)时遇到困难。虽然迭代检索方法通过收集更多信息来提高性能,但当前方法通常依赖于对大型语言模型(LLM)的多次调用。本文介绍了一种用于多跳问答的有效检索器 EfficientRAG。EfficientRAG 迭代地生成新的查询,无需在每次迭代时调用 LLM,并过滤掉不相关的信息。实验结果表明,EfficientRAG 在三个开放域多跳问答数据集上优于现有的 RAG 方法。
发布时间: 9/27/2024
查看原文
作者: Marina Hern\'andez-Bautista, Francisco J. Melero
三维模型中的不完整或缺失数据会导致渲染错误或缺陷,限制了其在可视化、几何计算和 3D 打印等应用中的实用性。传统的表面修复技术通常无法推断缺失区域中的复杂几何细节。神经网络通过使用修复技术成功地解决了二维图像中的填洞任务。将表面重建算法与模型的曲率特性和神经网络在修复过程中的创造性相结合,应该在孔洞完成任务中提供逼真的结果。在本文中,我们提出了一种名为 SR-CurvANN(基于曲率感知神经网络的表面重建)的新方法,该方法结合了基于神经网络的二维修复技术,可以有效地重建三维表面。我们使用表示数百个三维模型顶点处曲率的平面表示的图像来训练神经网络。一旦推断出缺失区域,粗到细的表面变形过程确保表面适合重建的曲率图像。我们的提议使得从各种训练的三维模型中学习和概括模式成为可能,从而生成全面的修复曲率图像和表面。在 959 个带有几个孔洞的模型上进行的实验表明,SR-CurvANN 在形状完成过程中表现出色,以非凡的真实感和精度填充孔洞。
发布时间: 9/27/2024
查看原文