arXiv:2502.06854v1 宣告类型: 交叉
摘要: 中间表示(IRs)是编译器设计和程序分析中的关键元素,但大型语言模型(LLMs)对其的理解仍然未被充分探索。本文提出了一项开创性的实证研究,调查了包括GPT-4、GPT-3、Gemma 2、LLaMA 3.1和Code Llama在内的LLMs在理解IRs方面的能力。我们分析了它们在四项任务上的表现:控制流图(CFG)重构、反汇编、代码总结和执行推理。我们的结果表明,虽然LLMs在解析IR语法和识别高层次结构方面表现出色,但在控制流推理、执行语义和循环处理方面存在困难。具体来说,它们往往误解分支指令,忽略关键的IR操作,并依赖基于启发式的推理,导致在CFG重构、IR反汇编和执行推理中的错误。该研究强调了对LLMs进行IR特定增强的必要性,建议在结构化的IR数据集上进行微调,并结合显式控制流模型以增强其理解和处理与IR相关任务的能力。
arXiv:2502.06853v1 跨越类型: cross
摘要:在过去十年中,核工程领域对机器学习(ML)的研究有了显著增长。随着许多方法达到成熟阶段,下一阶段的研究将确定ML模型在生产环境中的可行性和实用性。许多用于反应堆设计和评估的代码主要是用Fortran语言编写的,这与TensorFlow训练的ML模型不完全兼容。本研究提供了一个框架,在Fortran中实现深度神经网络(DNNs)和贝叶斯神经网络(BNNs),允许在无需TensorFlow的C API、Python运行时或ONNX转换的情况下进行本地执行。该框架设计用于使用便捷和计算效率高,可以在任何Fortran代码中实现,并支持迭代求解器和通过聚类或BNN进行不确定性量化(UQ)。通过一个包含两个输入和一个输出的噪声正弦波测试案例,进行了验证,将基于Fortran的预测与TensorFlow的预测进行了比较。DNN预测几乎无差异,实现了19.6倍的加速,而BNN预测则有轻微的分歧,这可能是由于随机数生成的不同。BNN推理实现了8.0倍的加速。该方法随后在预测关键热流(CHF)的核相关问题上进行了进一步验证,表现出类似的行为,同时实现了显著的计算效益。还讨论了该框架成功集成到CTF热力代码中的情况,概述了其实际用途。总体而言,该框架证明了在Fortran中有效实现DNN和BNN模型推理的能力,使基于ML的方法在实际核应用中的持续研究成为可能。
arXiv:2502.06852v1 宣告类型: cross
摘要:理解基于变压器的语言模型的内部机制仍然具有挑战性。基于电路发现的机制可解释性旨在通过分析其计算子图的内部过程来逆向工程神经网络。在本文中,我们重新审视了现有的基于梯度的电路识别方法,并发现它们的表现要么受到零梯度问题的影响,要么受到了饱和效应的影响,其中边缘可解释性分数对输入变化变得不敏感,导致电路组件的可解释性评估结果噪声大且不可靠。为应对饱和效应,我们提出了一种名为GradPath的边缘可解释性修补方法(EAP-GP)。EAP-GP引入了一条整合路径,从输入开始,并自适应地跟随受损输入和干净输入梯度差异的方向,以避免饱和区域。这种方法增强了可解释性的可靠性,并改善了电路识别的忠实性。我们使用GPT-2 Small、GPT-2 Medium和GPT-2 XL在这6个数据集上评估了EAP-GP。实验结果表明,EAP-GP在电路忠实性方面优于现有方法,实现了最高达17.7%的改进。与手动标注的真相地电路进行比较,EAP-GP的精确度和召回率达到了或优于之前的方法,突显了其在识别准确电路方面的有效性。
arXiv:2502.06851v1 交叉公告类型:cross
摘要:本文提供了一篇由人工智能生成的关于视觉-语言-动作(VLA)模型的综述,总结了关键方法、发现和未来方向。内容使用了大型语言模型(LLMs)生成,仅用于演示目的。本工作不代表原创研究,但突出了AI如何帮助自动化文献综述的过程。随着AI生成内容的日益普及,确保准确性、可靠性和适当综合仍是一项挑战。未来的研究将集中在开发AI辅助文献综述的结构化框架上,探索提高引文准确性、源可信度和上下文理解的技术。通过考察LLM在学术写作中的潜力和局限性,本研究旨在促进将AI整合到研究工作流程中的更广泛的讨论。本工作标志着建立系统化方法以利用AI进行文献综述生成的初步步骤,从而提高学术知识综合的效率和可扩展性。
arXiv:2502.06849v1 宣告类型:交叉
摘要:集成学习是提高神经网络预测性能的一种广泛应用的技术。然而,它会增加内存使用和推理时间。在这项工作中,我们提出了一种名为“神经元移植(NT)”的新型模型融合技术,在这种技术中,我们通过移植物质重要神经元到剪枝掉不重要神经元后获得的空缺位置来融合一组模型。移植后初始的性能下降可以通过微调快速恢复,从而在相同模型容量和架构的情况下,始终优于个体的集合成员。此外,NT 允许所有集合成员在结合的模型中共同进行剪枝和联合训练。与基于对齐的平均化(如最优传输融合)相比,它所需的微调时间更少,融合本身速度更快,占用的内存更少,而最终的模型性能可与之相比或更好。代码可通过以下链接获取:https://github.com/masterbaer/neuron-transplantation。
arXiv:2502.06848v1 交叉类型
摘要:近年来,基于图神经网络(GNN)的模型在模拟复杂系统的物理现象方面显示出有希望的结果。然而,训练专用的图网络物理模拟器可能是昂贵的,因为大多数模型受限于完全监督的训练,这需要来自传统物理模拟器的大量数据生成。到目前为止,转移学习如何提高模型性能和训练效率仍未被探索。在本文中,我们介绍了一种图网络模拟器的预训练和转移学习范式。我们提出了可扩展的图U-net(SGUNET)。通过采用创新的深度优先搜索(DFS)池化,SGUNET可以适应不同网格大小和分辨率的不同模拟任务。为了在不同配置的SGUNET之间实现转移学习,我们提出了一组映射函数以对齐预训练模型和目标模型之间的参数。还向损失中添加了一个额外的规范化项,以在预训练权重和目标模型权重之间限制差异,从而提高泛化性能。为了预训练我们的物理模拟器,我们创建了一个数据集,其中包括从开源A Big CAD(ABC)数据集随机选择的20,000个3D形状的物理模拟。我们展示了我们提出的转移学习方法即使在使用少量训练数据微调时,也能让模型比从完整扩展数据集重新训练时表现更好。在2D可变形板基准数据集中,我们使用1/16的训练数据预训练的模型在位置RMSE上比从头开始训练的模型提高了11.05%。
arXiv:2502.06846v1 类型: cross
摘要:蛋白质在生物体中发挥着关键作用,但理解其功能却面临着重大挑战,包括基于分类的方法灵活性有限、难以充分利用空间结构信息,以及缺乏系统评价指标来评估蛋白质问答系统。为了解决这些限制,我们提出了Prot2Chat,这是一种新颖的框架,它通过统一模块将多模态蛋白质表示与自然语言整合,从而实现大型语言模型(LLM)驱动的答案生成。我们的模型结合了一个修改后的ProteinMPNN编码器,该编码器以统一的方式编码蛋白质序列和结构信息,一个蛋白质-文本适配器,带有交叉注意力机制,以及一个LLaMA3解码器。为了优化训练效率,我们在编码器上冻结权重并使用LoRA技术对解码器进行训练。我们在这两个数据集上进行了实验,自动评估指标和专家评价都表明我们模型的优越性能。此外,零样本预测结果突显了其强大的泛化能力。该框架为将蛋白质领域知识与自然语言理解相结合提供了一个有前景的解决方案,为蛋白质相关研究的变革性进步铺平了道路。
arXiv:2502.06845v1 交叉类型:公告
摘要:核磁共振(NMR)光谱技术是一种关键的分析技术,用于分子结构解析,应用范围涵盖化学、生物学、材料科学和医学。然而,NMR光谱的频率分辨率受限于仪器的“场强”。高场NMR仪器提供高分辨率光谱,但价格昂贵,而低场仪器则提供更实惠但分辨率较低的结果。本文介绍了一种基于AI的方法,不仅通过超分辨率技术增强了NMR光谱的频率分辨率,还提供了多尺度功能。通过利用扩散模型,我们的方法可以从低场NMR数据重建高场光谱,提供了在不同磁场强度下生成光谱的灵活性。这些重建结果在质量上与高场仪器获得的光谱相媲美,能够提供更精细的光谱细节,并提高分子表征水平。到目前为止,我们的方法是第一个克服仪器场强限制的方法,通过AI实现NMR超分辨率。这一成本效益高的解决方案使高分辨率分析对更多的研究人员和行业来说更加可行,无需使用上千万美元的设备。
arXiv:2502.06844v1 平行类型:交叉
摘要:由于大型语言模型在广泛的应用中取得了成功,其规模一直在增加。这迫切需要减少内存使用,使其更具可访问性。后训练量化是一种流行的技术,它使用较少的位数(例如4-8位)表示模型而无需重新训练。然而,在超低位数设置下(例如2位)执行量化仍然是一个具有挑战性的任务。在本文中,我们提出了一种统一框架——InvarExplore,它可以系统地探索不同模型不变性,使我们能够利用每种不变性之间的协同作用。重要的是,InvarExplore具有一个离散搜索算法,使我们能够探索置换不变性,这种不变性由于不能用梯度为基础的方法优化,而未得到充分研究。结果表明,InvarExplore与现有的最新方法兼容,在强大的竞争对手方法上实现了额外的性能提升。
arXiv:2502.06843v1 Announce Type: cross
摘要:传统自动驾驶系统在处理复杂且意料之外的情况时,由于对空间关系的理解有限,经常难以进行推理。为此,本研究提出了一种基于大型语言模型(LLM)的自动驾驶(AD)辅助系统,该系统集成了视觉适配器和LLM推理模块,以增强视觉理解和决策能力。视觉适配器将YOLOv4与视觉变换器(ViT)结合,提取全面的视觉特征,而GPT-4则实现了类似人类的空间推理和响应生成。实验评估使用了45名经验丰富的驾驶员,结果显示该系统在描述情况方面接近人类表现,在生成适当响应方面与人类决策有一定的对齐。