LLM2D

arXiv 论文列表

作者: Wenwen Li, Chia-Yu Hsu, Sizhe Wang, Zhining Gu, Yili Yang, Brendan M. Rogers, Anna Liljedahl
arXiv:2504.17822v1 通知类型: cross 摘要: 北极地区的反进退冻融沉陷(RTS)是具有显著环境影响的独特永久冻土地貌。准确绘制这些RTS是至关重要的,因为它们的出现是永久冻土解冻的明显指示。然而,相对于其他地貌特征的较小规模、模糊边界以及时空变化,对它们的准确检测具有显著挑战。本文中,我们采用了最先进的深度学习模型——多尺度视觉变换器为基础的级联掩码R-CNN,来在北极地区划定RTS特征。引入了两种新的策略来优化多模态学习并提升模型的预测性能:(1)一种特征级别残余跨模态注意融合策略,该策略有效地将多种模态的特征图融合,捕获互补信息,并提高模型理解数据中复杂模式和关系的能力;(2)预先训练单模态学习,然后进行多模态微调,以降低计算需求,同时实现强大的模型性能。实验结果表明,我们的方法在数据级别融合、特征级别卷积融合以及各种注意融合策略中表现出众,提供了有关如何高效利用多模态数据进行RTS制图的宝贵见解。这项研究有助于我们对永久冻土地貌及其环境影响的理解。
发布时间: 4/28/2025
查看原文
作者: Ze Yang, Yihong Jin, Juntian Liu, Xinhe Xu, Yihan Zhang, Shuyang Ji
arXiv:2504.17807v1 宣告类型: 交叉 摘要:快速发展的云平台和日益复杂的网络流量要求进行适当的网络流量监控和异常检测,以确保网络安全和性能。本文介绍了一种基于大规模语言模型(LLM)的网络流量监控和异常检测系统。除了现有的模型如自动编码器和决策树外,我们利用大规模语言模型处理网络流量的序列数据,这使得我们能更好地捕捉潜在的复杂模式以及数据集中的细微波动。我们展示了一个混合模型是必要的,该模型将变换器架构中的注意力机制纳入监督学习框架中,以实现更好的准确性。预训练的大规模语言模型分析并预测可能的网络流量,同时增加了一个考虑时间和上下文的异常检测层。此外,我们提出了一种新的基于迁移学习的方法,以增强模型的有效性,使其能够快速适应未知的网络结构和对抗性条件,而不需要大量的带标签数据集。实际结果表明,所设计的模型在检测准确性和计算效率方面优于传统方法,能够有效识别各种网络异常,如零日攻击和流量拥堵模式,并显著降低了假阳性率。
发布时间: 4/28/2025
查看原文
作者: Tri Nguyen, Kelly Cohen
arXiv:2504.17805v1 类型: 横向研究 摘要:本文探讨了遗传模糊系统在为大学兼职学生员工高效生成工作时间表中的应用。给定员工的偏好工作小时数和可用性,我们的模型在考虑各种因素(如每周最大工作小时数、所需在岗员工数以及偏好工作小时数)的情况下生成可行的解决方案。该算法使用在辛辛那提大学收集的学生可用性数据进行训练和测试。结果表明,该算法在产生符合运营标准的工作时间表方面具有高效性,并且在人手不足的情况下具有鲁棒性。
发布时间: 4/28/2025
查看原文
作者: Xufeng Yao, Jiaxi Jiang, Yuxuan Zhao, Peiyu Liao, Yibo Lin, Bei Yu
arXiv:2504.17801v1 交叉论文类型: 对抗性 摘要:优化算法被广泛应用于解决复杂问题,但手动设计这些算法往往是劳动密集型的,需要大量的专业知识。电子设计自动化(EDA)中的全局布线是基本步骤。尽管分析方法在全局布线中处于最先进技术(SOTA)的地位,但其核心优化算法仍然高度依赖于启发式方法和定制组件,例如初始化策略、预处理方法和线搜索技术。本文提出了一种自动化框架,利用大规模语言模型(LLM)来进化全局布线的优化算法。我们首先通过精心设计的提示生成多样化的候选算法。然后,我们引入基于LLM的遗传流程来进化选定的候选算法。发现的优化算法在许多基准测试中表现出显著的性能改进。具体而言,在MMS、ISPD2005和ISPD2019基准测试中,我们的设计案例特定发现的算法分别实现了平均HPWL改进的**5.05%**、**5.29%**和**8.30%**,在个别情况下最高可达**17%**的改进。此外,发现的算法表现出良好的泛化能力,并能够补充现有的参数调优方法。
发布时间: 4/28/2025
查看原文
作者: S. L. Thomson, M. W. Przewozniczek
arXiv:2504.17799v1 交叉通知类型:cross 摘要:局部最优网络(LONs)捕获适应性景观信息。它们通常以黑盒方式构建;问题结构的信息并未被利用。这也适用于LON分析:在分析LON时,并未考虑诸如变量间的交互等关于问题的知识。我们通过替代方法挑战这一现状:我们探讨了如何通过结合基于子函数的信息来改进LON分析——这些信息可能是先验已知的,也可能是搜索过程中学习到的。为此,我们使用三种方法为几个基准伪布尔问题构建了LON:首先,标准算法;其次,使用确定性灰色盒交叉的算法;最后,根据关于变量交互的已学习信息选择扰动的算法。提出了与LON中子函数变化相关的度量标准,并将其与之前文献中捕获LON其他方面的度量标准进行了比较。在LON构建和分析中加入问题结构可以提供更多优化动态的信息。这些信息可能对于理解使用最先进的连结学习优化器求解给定问题的难度至关重要。鉴于研究结果,我们建议在具有已知或疑似子函数结构的问题的景观分析中采用包含问题结构的替代范式。
发布时间: 4/28/2025
查看原文
作者: Hauke Sandhaus, Angel Hsing-Chi Hwang, Wendy Ju, Qian Yang
arXiv:2504.17792v1 交叉发布类型: cross 摘要:安全关键数据,例如碰撞和接近碰撞记录,对于改善自动驾驶车辆(AV)的设计和开发至关重要。将此类数据跨AV公司、学术研究人员、监管机构和公众共享可以帮助所有AV变得更安全。然而,AV公司很少将安全关键数据对外共享。本文旨在确定AV公司为何不愿共享安全关键数据,并考察这些障碍如何为促进数据共享的新方法提供启示。我们采访了十二名积极在其日常工作中处理此类数据的AV公司员工。研究发现表明存在两个先前未知的关键性障碍(1)数据集本质上嵌入了对于提升AV安全至关重要的知识,并且资源密集。因此,即使是在同一公司内部,数据共享也充满政治考量。(2)受访者认为AV安全知识是公司的私有知识,为公司带来了竞争优势,而不是为了社会公益而公开的知识。我们讨论了这些发现对激励和促进安全关键AV数据共享的影响,特别是在(1)辩论和分类公共和私有AV安全知识方面的影响,(2)创新数据工具和数据共享管道,使之更容易分享公共AV安全数据和知识方面的影响;(3)抵消整理安全关键数据的成本并激励数据共享方面的影响。
发布时间: 4/28/2025
查看原文
作者: Anna Katariina Wisakanto, Joe Rogero, Avyay M. Casheekar, Richard Mallah
arXiv:2504.18536v1 宣布类型: 新 摘要: 现代通用人工智能(AI)系统提出了紧迫的风险管理挑战,因为它们迅速发展的能力和潜在的灾难性危害超出了我们可靠评估其风险的能力。当前的方法通常依赖于选择性测试和对风险优先级的未记录假设,经常未能认真尝试评估AI系统如何直接或间接地对社会和生物圈构成风险的途径集合。本文介绍了AI领域的概率风险评估(PRA)框架,将高可靠性行业(例如,核能、航空)已有的PRA技术应用于先进AI的新挑战。该框架引导评估者识别潜在风险,估计可能性和严重性,并在适当粒度上明确记录证据、基础假设和分析。该框架的实施工具将所有评估风险的综合风险估计综合成一个风险报告卡。这种方法系统地整合了三项进步:(1)面向方面的情景分析提供了一种由AI系统方面(如能力、领域知识、机会)的基本原理分类指导的系统化危害覆盖;(2)风险途径建模通过双向分析和纳入前瞻性技术来分析从系统方面到社会影响的因果链;以及(3)风险管理采用情景分解、参考尺度和明确追踪协议,以结构化有创新性或有限数据的可信预测。此外,该框架通过将各种评估方法整合到可比较的、量化的绝对风险估计中,以供关键决策使用,从而统一了不同的评估方法。我们已经将此作为AI开发人员、评估者和监管者的工作簿工具实现,并在项目网站上提供。
发布时间: 4/28/2025
查看原文
作者: Joshua Engels, David D. Baek, Subhash Kantamneni, Max Tegmark
arXiv:2504.18530v1 宣讲类型: 新颖 摘要: 可扩展的监督,一种较弱的人工智能系统监督较强系统的过程,被提议作为一种关键策略来控制未来的超级智能系统。然而,尚不清楚可扩展监督本身如何扩展。为了解决这一差距,我们提出了一种框架,该框架将成功监督的概率量化为监督者能力和被监督系统能力的函数。具体而言,该框架将监督建模为能力不匹配的参与者之间的博弈;参与者具有针对监督和欺骗的特定Elo评分,这些评分是其一般智能的分段线性函数,有两个平台对应于任务无能和任务饱和。我们通过修改后的Nim游戏验证了该框架,然后将其应用于四种监督游戏:“黑帮”、“辩论”、“后门代码”和“战争游戏”。对于每种游戏,我们发现量化领域性能如何依赖于一般人工智能系统能力的缩放定律(使用聊天机器人竞技场的Elo评分作为一般能力的代理指标)。然后我们在关于嵌套可扩展监督(NSO)的理论研究基础上建立,这是一种可信模型监督不信任的强大模型的过程,这些强大的模型随后成为下一个步骤中的可信模型。我们确定了NSO成功的情况,并从数值(并在某些情况下从分析)推导出最大化监督成功概率的最佳监督层级数量。在我们的数值示例中,当监督比基线监督者强400点Elo评分的系统时,NSO的成功率低于52%,并且在监督更强的系统时,成功率进一步下降。
发布时间: 4/28/2025
查看原文
作者: Peiyuan Jing, Kinhei Lee, Zhenxuan Zhang, Huichi Zhou, Zhengqing Yuan, Zhifan Gao, Lei Zhu, Giorgos Papanastasiou, Yingying Fang, Guang Yang
arXiv:2504.18453v1 宣告类型: 新 摘要: 影像学报告生成对于提高效率至关重要,但目前的模型缺乏专家的结构化推理能力,阻碍了临床的信任和可解释性,因为它们无法将视觉发现与精确的解剖位置链接起来。本文介绍了一种名为BoxMed-RL的开创性统一训练框架,旨在生成空间验证性和解释性的影像学报告。基于大型视觉-语言模型,BoxMed-RL通过两个集成的阶段革新了报告生成过程:(1)在预训练阶段,我们通过医学概念学习对模型进行优化,并使用思维链监督使模型内部化类似放射科医生的工作流程,然后进行空间验证强化,即将医疗发现与边界框对齐。 (2)在下游适配器阶段,我们冻结预训练权重并训练一个下游适配器,以确保流畅且临床可信的报告。该框架精确地模拟了放射科医生的工作流程,迫使模型将高层医学概念与明确的解剖证据联系起来。在公共数据集上的广泛实验表明,与最先进的方法相比,BoxMed-RL在METEOR和ROUGE-L指标上平均提高了7%。此外,基于大型语言模型的指标平均提高5%进一步证明了BoxMed-RL在生成高质量影像学报告方面的稳健性。
发布时间: 4/28/2025
查看原文
作者: Simon Dold, Malte Helmert, Jakob Nordstr\"om, Gabriele R\"oger, Tanja Schindler
arXiv:2504.18443v1 任务类型: 新颖 摘要: 我们引入了用于经典规划任务的下界证书,这些证书可以用来证明任务的不可解性或者计划的最优性,且这种证明可以通过第三方独立验证。我们描述了一种基于伪布尔约束生成下界证书的一般框架,这种框架对使用的规划算法持中立态度。 作为案例研究,我们展示了如何修改 $A^{*}$ 算法以产生具有良好开销的最优性证明,使用模式数据库启发式和 $h^\textit{max}$ 作为具体例子。相同的方法适用于任何其推断可以高效表达为伪布尔约束推理的启发式。
发布时间: 4/28/2025
查看原文