LLM2D

arXiv 论文列表

arXiv:2504.18854v1 交叉公告类型 摘要:应力分析是材料设计的一个重要部分。对于具有复杂微观结构的材料,例如两相随机材料(TRMs),材料失效通常伴随着应力集中。两相材料中的相界面对于应力集中至关重要。因此,相界处应力预测的误差至关重要。在实际工程中,获得的材料微观结构图像的像素数有限,这限制了深度学习方法生成的应力图像的分辨率,使得难以观察应力集中区域。现有的图像超分辨率(ISR)技术都基于数据驱动的监督学习。然而,应力图像具有自然的物理约束,这为新的ISR技术提供了新的思路。在本研究中,我们构建了一个针对TRMs的应力预测框架。首先,该框架使用了一个提出的多重组成U-net(MC U-net)来预测低分辨率材料微观结构的应力。通过考虑微观结构中的相界面信息,MC U-net有效地减少了相界处过度预测误差的问题。其次,我们提出了基于混合物理信息神经网络(MPINN)的方法进行应力ISR(SRPINN)。通过引入物理信息的约束,该新方法不需要配对的应力图像进行训练,并且可以将应力图像的分辨率提高到任意倍数。这使得能够在相界处的应力集中区域进行多尺度分析。最后,我们通过迁移学习对具有不同相体积分数和加载状态的TRMs进行了应力分析。结果显示,提出的应力预测框架具有满意的准确性和泛化能力。
发布时间: 4/29/2025
查看原文
作者: Hidayet Ersin Dursun, Yusuf G\"uven, Tufan Kumbasar
arXiv:2504.18847v1 通知类型: 横向 摘要:本文专注于设计一种基于深度学习的自动驾驶系统,并将其部署和测试在真实的麻省理工学院赛车上,以评估其在驾驶场景中的有效性。深度神经网络(DNN)以端到端的学习方式将原始图像输入转换为实时的转向指令,遵循模仿学习框架。设计的关键挑战是确保DNN预测的准确性和速度足够快,在高采样频率下实现不同运行条件下平滑的车辆操作。在这项研究中,我们设计并比较了各种DNN,以确定最适合实时自动驾驶的有效方法。在设计DNN时,我们采用了增量设计方法,通过增强模型容量和数据集来应对现实驾驶场景的挑战。我们设计了PD系统、CNN、CNN-LSTM和CNN-NODE,并在真实的MIT赛车上评估了它们的性能。虽然PD系统能够处理基本的车道跟随,但在应对急转弯和照明变化时表现出色。CNN改善了转向性能,但缺乏时间意识,而CNN-LSTM解决了这个问题,因为它实现了平滑的驾驶性能。CNN-NODE在处理驾驶动力学方面与CNN-LSTM表现相似,但在驾驶性能方面略有提高。这项研究的发现强调了在开发适用于自动驾驶应用的稳健DNN时迭代设计过程的重要性。实验视频可在https://www.youtube.com/watch?v=FNNYgU--iaY观看。
发布时间: 4/29/2025
查看原文
arXiv:2504.18845v1 类型: cross 摘要: 系统识别(SysID)对于利用实验数据建模和理解动力系统至关重要。虽然传统的SysID方法侧重于线性模型,但它们无法充分捕捉非线性动态的特点,从而推动了深度学习(DL)作为更强大的替代方法的采用。然而,基于DL的模型缺乏不确定性量化(UQ),这给可靠性和安全性带来了挑战,突显了整合UQ的必要性。本文介绍了一种系统性的框架,用于构建和学习区间神经网络(INNs),以在SysID任务中进行不确定性量化。INNs通过将预训练神经网络的可学习参数(LPs)转换为区间值LPs来获得,而无需依赖概率性假设。通过在整个网络中使用区间算术,INNs可以生成预测区间(PIs),有效地捕捉目标覆盖。我们扩展了长短期记忆(LSTM)和神经常微分方程(Neural ODEs),将其转化为区间LSTM(ILSTM)和区间NODE(INODE)架构,为其在SysID中的应用提供了数学基础。为了训练INNs,我们提出了一种结合了UQ损失函数和参数化技巧的DL框架,以处理区间LPs引发的约束。我们引入了新的概念“弹性”,以解释潜在的不确定性原因,并在SysID实验中验证了ILSTM和INODE,证明了它们的有效性。
发布时间: 4/29/2025
查看原文
作者: Teeradaj Racharak, Chaiyong Ragkhitwetsagul, Chommakorn Sontesadisai, Thanwadee Sunetnanta
arXiv:2504.18827v1 类型: cross 摘要: 在上下文学习(ICL)已成为大型语言模型(LLMs)的一种强大能力,使它们能够在未进行明确微调的情况下,基于提供的少量示例执行新任务。尽管这些模型具有令人印象深刻的适应性,但它们仍然对微妙的对抗性干扰易受攻击,并且在面对语言变化时表现出不可预测的行为。受软件测试原则的启发,我们引入了一个基于软件测试原则的框架,称为MMT4NL,用于通过利用对抗性干扰和软件测试技术来评估ICL的可信度。它包括语言能力的多样化评估方面,用于测试LLMs的ICL能力。MMT4NL围绕从测试集构建变种对抗性示例的想法建立,以量化和定位ICL设计提示中的问题。我们的哲学是将任何LLM视为软件,并像测试软件那样验证其功能。最后,我们在情感分析和问答任务中展示了MMT4NL的应用。我们的实验可以揭示最先进的LLMs中的各种语言问题。
发布时间: 4/29/2025
查看原文
arXiv:2504.18819v1 Announce Type: cross 摘要:AI模型在预测任务自动化方面引起了显著的研究关注。然而,大多数模型假设一个固定的学习环境,在这种情况下,这些模型无法处理非固定数据,因为它们会学习固定的关系。现有的解决方案建议在模型训练和评估之前使数据固定。这会导致趋势和季节性模式的丢失,而这些模式是研究系统时间依赖性的关键组成部分。这项研究旨在通过提出一种在潜在空间内强制实现固定行为的方法,同时保留趋势和季节性信息,来解决这一局限性。该方法采用了差分、时间序列分解和潜在空间算术(LSA)等技术,学习对趋势和季节性信息进行高效近似所需的关键信息,并将这些信息作为嵌入存储在变分自编码器(VAE)的潜在空间中。该方法在保留趋势和季节性信息方面的有效性在两个非固定时间序列数据集上进行了评估。为了评估预测性能,使用了四个深度学习模型对应用所提出方法后的数据集的潜在向量表示进行了训练,所有模型在使用均方根误差(RMSE)作为性能指标的情况下,与最先进的技术相比均取得了竞争力的结果。
发布时间: 4/29/2025
查看原文
作者: Abdelaziz Amara korba, Nour Elislem Karabadji, Yacine Ghamri-Doudane
arXiv:2504.18814v1 宣布类型:交叉 摘要:车辆网络(IoV)通过增强连接性和使自动驾驶成为可能而正在改变交通。然而,这种增加的互联互通性引入了新的安全漏洞。机器人木马和网络攻击对连接和自动驾驶车辆(CAVs)构成了显著风险,如实际事件中远程车辆系统被妥协的事件所示。为应对这些挑战,我们提出了一种基于边缘的入侵检测系统(IDS),该系统监测通往和来自CAVs的网络流量。我们的检测模型基于一个元集成分类器,能够识别已知(Nday)攻击并检测之前未见过的(零日)攻击。该方法涉及在多接入边缘计算(MEC)服务器上训练多个孤立森林(IF)模型,每个IF专注于识别特定类型的机器人木马攻击。这些IF,要么在当地训练,要么由其他MEC节点共享,然后通过基于粒子群优化(PSO)的堆叠策略进行聚合,构建一个稳健的元分类器。提出的IDS已经在 vehicular botnet 数据集上进行了评估,对于已知攻击(N-day攻击)的平均检测率为92.80%,对于零日攻击的检测率为77.32%。这些结果突显了我们解决方案在检测已知和新兴威胁方面的有效性,为IoV生态系统内的CAVs提供了一种可扩展和自适应的防御机制。
发布时间: 4/29/2025
查看原文
作者: Yifan Xie, Fei Ma, Yi Bin, Ying He, Fei Yu
arXiv:2504.18810v1 类型: cross 摘要:使用任意语音音频生成谈话人脸视频是数字人类技术领域的一项重大挑战。先前的研究强调了音频口唇同步和视觉质量的重要性。目前,对视觉不确定性学习的重视程度有限,这在现有的系统中造成了几个问题,包括视觉质量不一致以及不同输入条件下的不可靠性能。为了解决这个问题,我们提出了一种联合不确定性学习网络(JULNet),用于高质量的谈话人脸视频生成,并将与视觉错误直接相关的不确定性表示纳入其中。具体来说,我们首先设计了一个不确定性模块,在获取生成图像后分别预测错误图和不确定性图。错误图表示生成图像与真实图像之间的差异,而不确定性图用于预测不正确估计的可能性。此外,通过引入直方图技术来近似分布,我们通过KL散射项将不确定性分布与错误分布匹配。通过同时优化错误和不确定性,可以增强我们模型的性能和鲁棒性。广泛的经验表明,我们的方法在谈话人脸视频生成中的高保真度和音频口唇同步方面优于先前的方法。
发布时间: 4/29/2025
查看原文
arXiv:2504.18807v1 类型:交叉 摘要:本文批评了学术研究中的数字克隆现象,指出其如何体现AI解决方案主义。数字克隆通过复制用户数据来模拟行为,通常被视为用于行为洞察的可扩展工具。然而,这种框架模糊了同意、自主权和代表性的伦理关切。参考女性主义关于自主权的理论,本文认为数字克隆过度简化了人类的复杂性,并可能加剧系统性偏见。为了应对这些问题,它提议建立去中心化的数据仓库和动态同意模型,促进道德的、情境感知的AI实践,以挑战AI解决方案主义的还原论逻辑。
发布时间: 4/29/2025
查看原文
arXiv:2504.18805v1 Announce Type: cross 摘要:从科学论文生成引人入胜且准确的短视频具有挑战性,主要是因为内容复杂性和专家作者与读者之间的差距。现有的端到端方法往往难以避免事实性的不准确和视觉上的瑕疵,从而限制了它们在科学传播中的应用价值。为了解决这些问题,我们提出了SciTalk这一创新的多LLM代理框架,该框架将视频内容扎根于多种来源,如文本、图表、视觉风格和虚拟化身。受到内容创作者工作流程的启发,SciTalk使用了专门的代理来进行内容摘要、视觉场景规划以及文本和布局编辑,并引入了一种迭代反馈机制,在此机制中,视频代理模拟用户角色,对前一迭代生成的视频提供反馈并优化生成提示。实验评估结果显示,SciTalk在经过优化循环视频生成后,相比于简单提示方法,在生成科学准确又引人入胜的内容方面表现更优。尽管初步结果仍未达到人类创作者的质量标准,但我们的框架为基于反馈驱动的视频生成提供了宝贵的见解。我们的代码、数据和生成的视频将公开提供。
发布时间: 4/29/2025
查看原文
arXiv:2504.18804v1 跨领域类型: 摘要:错误报告包含了开发者进行软件错误分类和修复所需的信息。然而,不清晰、不完整或含糊的信息可能会导致分类和修复过程中的延误和过量的手动努力。本文探讨了是否可以通过对大语言模型(LLMs)进行指令微调,自动将非正式的、未结构化的错误报告转换为高质量、符合标准模板的结构化错误报告。我们使用三种开源指令微调的LLM(Qwen 2.5、Mistral和Llama 3.2),与ChatGPT-4o进行评估,通过现有的CTQRS、ROUGE、METEOR和SBERT等指标进行性能测量。实验结果表明,微调后的Qwen 2.5的CTQRS得分为**77%**,超过了微调后的Mistral(**71%**)、Llama 3.2(**63%**)以及ChatGPT在三轮学习中的表现(**75%**)。进一步的分析显示,Llama 3.2在检测缺少字段(尤其是预期行为和实际行为)方面表现出更高的准确性,而Qwen 2.5在捕捉重现步骤方面表现更出色,F1分数为76%。对其他流行项目(例如Eclipse、GCC)进行的额外测试表明,我们的方法具有很好的通用性,在未见过的项目错误报告中的CTQRS得分达到了**70%**。这些发现突显了指令微调在自动化结构化错误报告生成方面的潜力,可以减少开发者的手动努力,简化软件维护过程。
发布时间: 4/29/2025
查看原文