LLM2D

arXiv 论文列表

作者: Agni Bandyopadhyay, Guenther Waxenegger-Wilfing
本研究提出了一种将掩蔽近端策略优化 (PPO) 算法(来自深度强化学习 (RL) 领域)应用于确定最有效空间碎片访问顺序的新方法,并利用 Izzo 对拉姆伯特求解器的改进来实现单个交会。目标是优化访问所有给定碎片的顺序,以使整个任务的交会总时间最短。开发了一个神经网络 (NN) 策略,并在具有不同碎片场的模拟太空任务中进行训练。训练后,神经网络使用 Izzo 对拉姆伯特机动的改进来计算近似最优路径。性能评估了任务规划中的标准启发式方法。强化学习方法通过优化碎片交会顺序,显著提高了规划效率,与遗传算法和贪婪算法相比,总任务时间分别平均减少了 {10.96%} 和 {13.66%}。该模型平均在各种模拟场景中确定了最节省时间的碎片访问顺序,并具有最快的计算速度。这种方法标志着空间碎片清除任务规划策略的重大进步。
发布时间: 9/26/2024
查看原文
作者: Amna Khalid, Ayma Khalid, Umar Khalid
大型语言模型 (LLMs) 在医疗保健领域的应用因其处理复杂医疗数据并为临床决策提供见解的能力而备受关注。这些模型在理解和生成自然语言方面展现出强大的能力,这对于医疗文档、诊断和患者互动至关重要。本文回顾了语言模型从早期阶段到目前最先进的 LLM 的发展轨迹,重点介绍了它们在医疗保健应用中的优势,并讨论了数据隐私、偏差和伦理考量等挑战。文章探讨了 LLM 增强医疗保健交付的潜力,以及确保其在医疗实践中得到伦理和有效整合的必要步骤。
发布时间: 9/26/2024
查看原文
作者: Srikar Babu Gadipudi, Srujan Deolasee, Siva Kailas, Wenhao Luo, Katia Sycara, Woojun Kim
信息型路径规划 (IPP) 是机器人学中的一项关键任务,其中代理必须设计路径以收集有关目标环境的有价值信息,同时遵守资源约束。强化学习 (RL) 已被证明对 IPP 很有效,但是,它需要环境交互,这在实践中存在风险且成本高昂。为了解决这个问题,我们提出了一种基于离线 RL 的 IPP 框架,该框架在训练期间无需实时交互即可优化信息增益,通过避免交互提供安全性和成本效益,以及在执行期间提供卓越的性能和快速计算——RL 的主要优势。我们的框架利用批约束强化学习来减轻外推误差,使代理能够从任意算法生成的预先收集的数据集中学习。我们通过广泛的模拟和真实世界实验验证了该框架。数值结果表明,我们的框架优于基线,证明了所提出方法的有效性。
发布时间: 9/26/2024
查看原文
作者: Vincenzo Petrone, Enrico Ferrentino, Pasquale Chiacchio
这篇立场文件探讨了人工智能 (AI) 在先进制造业中与力控机器人任务的整合,而先进制造业是工业 4.0 的基石。人工智能在增强机器人操纵器(第四次工业革命的关键驱动因素)方面的作用正在迅速推动智能制造领域的重大创新。本文旨在将这些创新应用于实际的力控应用中,例如去毛刺、抛光和装配任务(如插销孔(PiH)),强调它们对于维护高质量生产标准的必要性。本文通过报道最近基于人工智能的方法,对比了这些方法,并确定了未来研究中需要解决的当前挑战。分析最后对未来的研究方向进行了展望,强调需要制定通用的性能指标来验证人工智能技术,整合各种增强功能以优化性能,以及在相关场景中验证其重要性。这些未来的方向旨在与已采用的方法保持一致,以便与制造标准兼容,从而提高人工智能驱动方法在学术和工业领域的相关性。
发布时间: 9/26/2024
查看原文
作者: \'Alvaro Fern\'andez Corral, Nicol\'as Mendoza, Armin Iske, Andrey Yachmenev, Jochen K\"upper
我们提出了一种计算框架,使用高阶隐式龙格-库塔物理信息神经网络(IRK-PINNs)方案来获取非线性耦合微分方程组的多维相空间解。基于最初解决依赖于坐标的场的微分方程的基础工作 [J. Comput. Phys. 378, 686 (2019)],我们调整了该方案以适应将坐标视为函数的上下文。这种修改使我们能够有效地求解粒子在外部场中的运动方程。我们的方案对于显式时间无关和周期性场特别有用。我们将此方法应用于成功求解放置在中心力场中的质量粒子和周期性电场中的带电粒子的运动方程。
发布时间: 9/26/2024
查看原文
作者: Carlos E. Luis, Alessandro G. Bottero, Julia Vinogradska, Felix Berkenkamp, Jan Peters
在部分可观测性下进行最优决策需要对环境隐藏状态的不确定性进行推理。然而,大多数强化学习架构使用没有内部机制来将隐藏状态表示中的不确定性纳入其中的序列模型来处理部分可观测性,例如循环神经网络、确定性状态空间模型和转换器。受强化学习中概率世界模型进展的启发,我们提出了一种独立的卡尔曼滤波器层,该层在线性状态空间模型中执行闭式高斯推理,并在无模型架构中端到端地训练它以最大化回报。与高效的线性循环层类似,卡尔曼滤波器层使用并行扫描处理顺序数据,该扫描随序列长度呈对数增长。通过设计,卡尔曼滤波器层可以替代标准无模型架构中的其他循环层,但重要的是,它们包含一个用于对潜在状态表示进行概率滤波的显式机制。在各种具有部分可观测性的任务中的实验表明,卡尔曼滤波器层在不确定性推理对于决策至关重要的任务中表现出色,优于其他有状态模型。
发布时间: 9/26/2024
查看原文
作者: Maximilian Andreas Hoefler, Karsten Mueller, Wojciech Samek
电力网是众多行业的重要组成部分,无缝地向工业流程和技术提供电力,使其安全可靠运行至关重要。然而,由于地形崎岖或气候条件恶劣,电力线难以检查。因此,无人机越来越多地用于检查电力线,从而产生大量需要快速准确处理的视觉数据。深度学习方法已成为这项任务的热门选择,证明了其在故障检测方面的价值。特别是,绝缘子缺陷的检测对于预测电力线故障至关重要,因为其故障会导致传输中断。因此,持续维护和严格检查绝缘子组件具有重要意义。在这项工作中,我们提出了一种新颖的管道来解决这项任务。我们利用最先进的目标检测技术来检测并随后分类单个绝缘子异常。我们的方法通过微调方法来解决数据集挑战,例如不平衡和运动模糊图像,这使我们能够通过提高异常绝缘子的分类准确率来改变模型的分类重点。此外,我们还采用可解释的 AI 工具来精确定位和解释异常。这种提出的方法有助于异常检测领域,特别是基于视觉的工业检查和预测性维护。我们显著提高了缺陷检测精度,最高可达 13%,同时还提供了模型误分类和定位质量的详细分析,展示了我们的方法在真实世界数据中的潜力。
发布时间: 9/26/2024
查看原文
作者: Alexander Rubinstein, Luca Scimeca, Damien Teney, Seong Joon Oh
训练一个多样化的模型集合具有多种实际应用,例如为模型选择提供候选模型,从而获得更好的分布外(OOD)泛化能力,以及利用贝叶斯原理实现 OOD 样本的检测。现有的多样化集成训练方法鼓励模型在提供的 OOD 样本上产生分歧。然而,这种方法计算量大,并且需要良好分离的 ID 和 OOD 示例,因此只在小规模设置中得到验证。 **方法。** 本文提出了一种可扩展集成多样化(SED)方法,该方法适用于大规模设置(例如 ImageNet),并且不需要 OOD 样本。相反,SED 会动态识别训练中的困难样本,并鼓励集成成员对这些样本产生分歧。为了提高可扩展性,我们展示了如何避免现有方法中对模型进行全面成对差异分析的昂贵计算。 **结果。** 我们在 ImageNet 上进行了实验,评估了多样化的益处。首先,对于 OOD 泛化,我们在多种设置中观察到多样化带来的巨大益处,包括输出空间(经典)集成和权重空间集成(模型汤)。其次,对于 OOD 检测,我们将集成假设的多样性转化为一种新颖的不确定性评分估计器,该估计器超过了大量的 OOD 检测基线。 代码地址:https://github.com/AlexanderRubinstein/diverse-universe-public.
发布时间: 9/26/2024
查看原文
作者: Mohsen Ghaffari, Mahsa Varshosaz, Einar Broch Johnsen, Andrzej W\k{a}sowski
表格型强化学习方法无法直接在连续状态空间上运作。针对这一问题,一种解决方案是对状态空间进行划分。良好的划分能够在学习过程中实现泛化,并更有效地利用先前的经验。因此,学习过程变得更快,并产生更可靠的策略。然而,划分会引入近似,这在状态分量之间存在非线性关系的情况下尤其有害。理想的划分应该尽可能粗略,同时捕捉到给定问题状态空间的关键结构。这项工作通过符号执行从环境动力学中提取划分。我们表明,符号划分提高了环境行为方面的状态空间覆盖率,并允许强化学习在稀疏奖励情况下表现更好。我们评估了符号状态空间划分在精度、可扩展性、学习代理性能和学习策略的状态空间覆盖率方面的表现。
发布时间: 9/26/2024
查看原文
作者: Alexander Hinterleitner, Thomas Bartz-Beielstein, Richard Schulz, Sebastian Spengler, Thomas Winter, Christoph Leitenmeier
可解释人工智能(XAI)的研究正在不断发展,旨在使深度学习模型更加透明。大多数XAI方法侧重于为安全相关应用中人工智能(AI)系统的决策提供理由。然而,很少有人关注使用这些方法来提高深度学习算法的性能和鲁棒性。此外,许多现有的XAI工作主要针对分类问题。在本研究中,我们研究了特征归因方法在回归问题中过滤掉无信息特征的潜力,从而提高预测的准确性和稳定性。我们介绍了一种特征选择管道,它将集成梯度与k均值聚类相结合,从初始数据空间中选择最佳变量集。为了验证这种方法的有效性,我们将其应用于一个现实世界的工业问题——涡轮机械开发过程中的叶片振动分析。
发布时间: 9/26/2024
查看原文