LLM2D

arXiv 论文列表

作者: Sviatoslav Dzhenzher, Michael H. Freedman
arXiv:2504.05255v2 通告类型: replace-cross 摘要:鉴于柯尔莫戈罗夫和阿诺尔德(KA)表示定理被视为表示或“表达”函数的算法,我们通过分析其抵御对抗攻击的能力来测试其鲁棒性。我们发现,KA能抵御可数连续对手的攻击,但揭示了一个关于外层函数等连续性的问题,目前这一问题阻碍了我们对极限进行操作,并且无法击败连续对手群。关于外层函数的正则性的问题与KA在一般神经网络理论中的适用性争议密切相关。
发布时间: 5/1/2025
查看原文
作者: Tianyu Chen, Xingcheng Fu, Yisen Gao, Haodong Qian, Yuecen Wei, Kun Yan, Haoyi Zhou, Jianxin Li
arXiv:2503.18578v2 通知类型: 交叉替换 摘要: 现代多模态视觉语言模型(VLMs)在向量空间,尤其是欧几里得空间中发展了Patch嵌入和卷积骨干网络,这在模型最初的构建中就已确立。当将VLMs扩展到银河尺度以理解天文现象时,行星轨道的球面空间和黑洞的双曲空间的集成提出了两大挑战。a) 当前的预训练模型局限于欧几里得空间,而不是全面的几何嵌入。b) 主导的架构缺乏适合各向异性物理几何结构的骨干网络。本文中,我们提出了一个几何感知的VLM——Galaxy-Walker,用于宇宙级别的视觉理解任务。我们提出了几何提示,通过在多尺度物理图上的多样化空间中进行随机行走生成几何令牌,并提出了一种几何适配器,以混合专家的方式压缩和重塑空间各向异性。广泛的实验表明了我们方法的有效性,Galaxy-Walker在星系属性估计($R^2$分数最高可达0.91)和形态分类任务(具有挑战性的特征在F1分数上提高0.17)中均取得了最佳性能,显著优于专门领域的模型和通用的VLMs。
发布时间: 5/1/2025
查看原文
作者: Weihang Su, Baoqing Yue, Qingyao Ai, Yiran Hu, Jiaqi Li, Changyue Wang, Kaiyuan Zhang, Yueyue Wu, Yiqun Liu
arXiv:2503.14258v3 宣布类型: replace-cross 摘要:本文介绍了JuDGE(判决书生成评估),这是一种针对中国法律系统中的判决书生成性能的新型基准。我们将任务定义为从给定的案件事实描述中生成完整的法律判决书。为了构建这一基准,我们构建了一个综合的数据库,其中包括真实法律案例的事实描述及其相应的完整判决书,作为生成文档质量的参考标准。我们还通过两个外部法律语料库进一步增强了该数据库,提供了任务所需的额外法律知识:一个包含法律法规,另一个包含大量以往判决书的集合。在法律专业人士的合作下,我们建立了一个全面的自动化评估框架,以从多维度评估生成判决书的质量。我们使用通用和法律领域的大语言模型(LLM)评估了多种基线方法,包括少样本上下文学习、微调和多源检索增强生成(RAG)方法。实验结果表明,虽然RAG方法可以有效提高在此任务中的性能,但仍然有很大的改进空间。所有代码和数据集均可在以下链接获取:https://github.com/oneal2000/JuDGE。
发布时间: 5/1/2025
查看原文
作者: Jintao Zhang, Guoliang Li, Jinyang Su
arXiv:2503.01713v2 通告类型: replace-cross 摘要:检索增强生成(RAG)在特定语料库中执行问答(QA)任务方面展示了显著的能力。然而,RAG在问答中的许多失败案例仍然存在。这些失败不仅仅归因于大型语言模型(LLMs)的局限性;相反,它们主要是由于当前RAG方法在分段时未考虑语义,导致难以找到相关背景,因为问题和段落之间的相关性受损。其次,存在一个权衡关系:在检索较少背景时可能会遗漏重要背景,而在检索更多背景时可能会获取不相关背景。 在这篇论文中,我们提出了一种RAG框架(SAGE)来克服这些限制。首先,为了在不分段时解决语义问题,我们建议训练一个语义分割模型。该模型经过训练可以将语料库分割成语义上完整的片段。其次,为了确保仅检索最相关的片段而忽略不相关的片段,我们设计了一个片段选择算法,基于相关性分数的下降速度动态选择片段,从而实现更相关的选择。第三,为了进一步确保检索到的片段的精确性,我们建议让LLMs评估检索到的片段是否过多或不足,并相应地调整上下文量。实验证明,SAGE在问答质量上平均超过了基础模型61.25%。此外,通过避免检索噪声背景,SAGE降低了LLM推理中消耗的令牌成本,并在平均成本效率上提高了49.41%。此外,我们的工作为提升RAG提供了宝贵的见解。
发布时间: 5/1/2025
查看原文
作者: Pankaj Choudhury, Yogesh Aggarwal, Prabhanjan Jadhav, Prithwijit Guha, Sukumar Nandi
arXiv:2503.01453v2 重大类型: 交叉替换 摘要: 目前大多数图像字幕合成工作使用计算密集型的深度神经网络,并生成英语描述。这往往限制了这一重要的辅助工具在语言和无障碍方面的广泛应用。本文介绍了AC-Lite,一种用于低资源旁遮普语的计算高效图像字幕模型。AC-Lite通过用轻量级替代方案替换计算密集型的深度网络组件来减少计算需求。AC-Lite模型通过大量不同图像特征提取网络和语言解码器的消融实验进行设计。使用ShuffleNetv2x1.5与基于GRU的语言解码器以及双线性注意力的组合被发现可以在计算成本最低的情况下提供最佳性能。AC-Lite在COCO-AC数据集上的CIDEr得分为82.3,计算量为2.45 GFLOPs,参数量为22.87M。
发布时间: 5/1/2025
查看原文
作者: Jong Ho Jhee, Alberto Megina, Pac\^ome Constant Dit Beaufils, Matilde Karakachoff, Richard Redon, Alban Gaignard, Adrien Coulet
arXiv:2502.21138v2 Announce Type: replace-cross 摘要:背景:随着医疗服务数据的不断增加,预测建模在生物医学领域找到了许多应用,例如对各种状况的风险水平进行评价,从而指导临床决策。然而,在某些情况下,知识图谱数据表示及其嵌入在生物医学预测建模中的应用尚不明确。方法:我们模拟了具有颅内动脉瘤患者的合成但现实的数据,并对预测其临床结局的任务进行了实验。我们比较了各种分类方法在表格数据与相同数据的图表示之间的性能。接着,我们研究了采用的表示单一数据的第一个模式和表示时间数据的第二个模式对预测性能的影响。结果:我们的研究表明,在我们的案例中,对于观察数据的预测任务,图表示和图卷积网络(GCN)嵌入达到了最佳性能。我们强调了所采用模式的重要性,并且在表示单一数据时考虑了实际值的重要性。我们的研究还削弱了各种时间编码对GCN性能的相对影响。
发布时间: 5/1/2025
查看原文
作者: Filip Ekstr\"om Kelvinius, Oskar B. Andersson, Abhijith S. Parackal, Dong Qian, Rickard Armiento, Fredrik Lindsten
arXiv:2502.06485v2 宣告类型: replace-cross 摘要:晶体材料通常表现出高度的对称性。然而,大多数生成模型并不考虑对称性,而是对每个原子的位置和元素没有任何约束地进行建模。我们提出了一种生成模型——Wyckoff 扩散(WyckoffDiff),它可以生成基于对称性的晶体描述。这是通过考虑包含所有对称性的晶体结构表示来实现的,并设计了一种新颖的神经网络架构,能够在离散生成模型框架中利用这种表示。此外,我们的模型的离散性质使得生成过程非常快速。我们还介绍了一个新的度量标准—— fracéchet Wrenformer 距离,它可以捕捉生成材料的对称方面,并且我们对 WyckoffDiff 进行了基准测试,将其与最近提出的晶体生成生成模型进行了比较。代码可以在 https://github.com/httk/wyckoffdiff 上在线获取。
发布时间: 5/1/2025
查看原文
作者: Zixue Zeng, Xiaoyan Zhao, Matthew Cartier, Tong Yu, Jing Wang, Xin Meng, Zhiyu Sheng, Maryam Satarpour, John M Cormack, Allison Bean, Ryan Nussbaum, Maya Maurer, Emily Landis-Walkenhorst, Dinesh Kumbhare, Kang Kim, Ajay Wasan, Jiantao Pu
arXiv:2501.17690v2 宣布类型: replace-cross 摘要:我们提出了一种新颖的结合分割感知联合训练框架,称为生成强化网络(GRN),该框架将分割损失反馈集成到一个单一阶段中,以同时优化图像生成和分割性能。还开发了一种图像增强技术,称为分割指导增强(SGE),生成器生成的图像专门针对分割模型。此外,还开发了GRN的两种变体,包括样本高效学习(GRN-SEL)和半监督学习(GRN-SSL)变体。GRN的性能使用一个包含69例完整标注的3D超声扫描数据集的29个受试者的数据进行了评估。其中,注释包括六种解剖结构:表皮、浅层脂肪、浅层筋膜膜(SFM)、深层脂肪、深层筋膜膜(DFM)和肌肉。结果显示,与在完全标注数据集上训练的模型相比,使用SGE的GRN-SEL在Dice相似性系数(DSC)上提高了1.98%,同时将标注努力减少了多达70%。仅使用GRN-SEL将标注努力减少了60%,使用SGE的GRN-SSL将标注需求减少了70%,仅使用GRN-SSL将标注需求减少了60%,同时模型性能与完全监督模型相当。这些结果表明,GRN框架在显著减少标注数据的情况下优化分割性能的有效性,提供了一种用于超声图像分析的可扩展且高效的方法,并减少了与数据标注相关的负担。
发布时间: 5/1/2025
查看原文
arXiv:2501.01991v2 宣告类型: 替换-交叉 摘要:模型检验是一种形式验证技术,确保系统满足预定义的要求,在开发过程中起到减少错误和提高质量的关键作用。本文介绍了一种新颖的混合框架,将模型检验与深度学习相结合,用于医学影像中的脑肿瘤检测和验证。通过将模型检验原则与基于CNN的特征提取和K-FCM聚类相结合进行分割,所提出的方法提高了肿瘤检测和分割的可靠性。实验结果突显了该框架的有效性,准确率为98%,精确率为96.15%,召回率为100%,展示了其作为高度可靠的工具在高级医学图像分析中的潜力。
发布时间: 5/1/2025
查看原文
作者: Erica Chiang, Divya Shanmugam, Ashley N. Beecy, Gabriel Sayer, Deborah Estrin, Nikhil Garg, Emma Pierson
arXiv:2412.16406v2 公告类型: replace-cross 摘要: 疾病进展模型在许多进行性疾病的确诊和治疗中得到了广泛应用。然而,现有模型的一个显著限制是,它们没有考虑到会影响观察数据的健康不平等现象。为了解决这一问题,我们开发了一种可解释的贝叶斯疾病进展模型,该模型捕捉了三个关键的健康不平等现象:某些患者群体(1)可能在疾病更为严重时才开始接受治疗,(2)即使在接受治疗的情况下,疾病进展也更快,或者(3)在疾病严重程度较高的情况下接受随访治疗的频率较低。我们从理论和实证上证明,忽视其中任何一种不平等现象会导致严重程度估计出现偏差(例如,低估了不利群体的严重程度)。在心力衰竭患者的 datasets 上,我们展示了我们的模型能够识别出面临每种健康不平等现象的群体,并且在推断疾病严重程度时考虑这些不平等现象,显著改变了被认为是高风险的患者群体。
发布时间: 5/1/2025
查看原文