arXiv 论文列表

作者: Navdeep Kumar, Adarsh Gupta, Maxence Mohamed Elfatihi, Giorgia Ramponi, Kfir Yehuda Levy, Shie Mannor

arXiv:2502.09432v1 宣告类型: 新摘要: 我们研究非矩形不确定性集的鲁棒马尔可夫决策过程（RMDPs），这类模型能够捕捉状态间的相互依赖性，不同于传统的矩形模型。虽然非矩形模型在近似中的鲁棒策略评估通常是NP难问题，但我们可以识别出一类由于其结构简洁性而避免这些复杂性障碍的$L_p$-有界不确定性集。我们进一步表明，这种类别可以分解为无穷多个\texttt{sa}-矩形$L_p$-有界集，并利用其结构特性推导出$L_p$ RMDPs的新对偶形式。这种形式提供了对手策略的关键见解，并使我们能够为非矩形RMDPs开发第一个鲁棒策略评估算法。实证结果表明，我们的方法显著优于穷举方法，为未来非矩形鲁棒MDP的研究奠定了有希望的基础。

发布时间: 2/14/2025

查看原文

一种用于拍打式机器人翅膀的深度逆映射模型

作者: Hadar Sharvit, Raz Karl, Tsevi Beatus

arXiv:2502.09378v1 通告类型: 新摘要: 在系统控制中，系统的动态是由调节其输入来实现期望结果的。例如，为了控制四旋翼无人机螺旋桨的推力，控制器会调节其旋转速度，依赖于输入旋转速度与推力之间的简单映射。这种映射可以反转来确定生成所需推力所需的旋转速度。然而，在复杂的系统中，如涉及复杂流体运动的扑翼机器人，将输入（翅膀运动学）映射到结果（空气动力学力）并不简单，实时反转这种映射在计算上是不切实际的。在这里，我们报道了一种基于我们开发的实验系统数据的机器学习解决方案，用于扑翼系统的逆映射。我们的模型学习生成所需空气动力学力所需的输入翅膀运动。我们使用了一种针对时间序列数据进行调整的序列到序列模型，并通过新颖的自适应频谱层在频域中实现了表示学习。为了训练我们的模型，我们开发了一个同时使用高速相机测量翅膀空气动力学力和三维运动的扑翼系统。我们在另一个开源数据集上展示了我们系统的性能，该数据集包含不同流动状况下的扑翼翅膀。结果表明，与更复杂的基于最先进的变压器模型相比，我们的模型在测试数据集上的中位损失提高了11%的性能。此外，我们的模型展示了更优秀的推理时间，使其适用于机载机器人控制。我们开源的数据和框架可能有助于改进受复杂动力学约束的系统建模和实时控制，从仿生机器人到医疗设备。

发布时间: 2/14/2025

查看原文

情感计算中的不确定陛：在数据收集实践中考虑意义和语境

作者: Bernd Dudzik, Tiffany Matej Hrkalovic, Chenxu Hao, Chirag Raman, Masha Tsfasman

arXiv:2502.09294v1 宣布类型: 新摘要: 自动情感预测 (AAP) 使用对输入数据（如文本、语音、图像和生理信号）的计算分析来预测各种情感现象（例如情绪或心情）。这些模型通常使用监督机器学习算法构建，这些算法严重依赖标记的训练数据集。在这一立场论文中，我们认为所有 AAP 的训练数据都源自人类的情感解释过程，形成了某种情感意义。人类情感研究显示了一种基本的情感意义形式：可以包含我们在这里泛指的不确定性的品质（QIs）——包括主观性（意义依赖于谁在解释）、不确定性（对意义正确性的信心不足）、歧义性（意义包含互相排斥的概念）和模糊性（意义位于嵌套层次结构的不同水平）。未能适当考虑 QIs 导致无法进行有意义和可靠的预测。基于这一前提，我们主张在充分解决 AAP 中的不确定性的一个关键步骤是开发涉及系统考虑 1) 相关的 QIs 集合以及 2) 相关解释过程的上下文的数据收集方法。为此，我们 1) 阐述了 AIPs 的概念模型以及由这些解释产生的意义所关联的 QIs，并提供了相关上下文的概念结构，支持对其作用的理解。最后，我们利用我们的框架 2) 讨论了在数据收集设置中解决 QIs 相关的上下文依赖性挑战的示例。我们认为我们的努力可以促进对不确定性和上下文在 AAP 研究中作用的结构化讨论，从而为更好的数据收集和分析实践的发展提供指导。

发布时间: 2/14/2025

查看原文

从大型语言模型到多模态AI：生成式AI在医学领域的潜力概览研究

作者: Lukas Buess, Matthias Keicher, Nassir Navab, Andreas Maier, Soroosh Tayebi Arasteh

arXiv:2502.09242v1 宣布类型: 新摘要: 生成型人工智能（AI）模型，如扩散模型和OpenAI的ChatGPT，正在通过提高诊断准确性和自动化临床工作流程来改变医学领域。该领域进展迅速，从仅处理文本的大语言模型（用于临床记录和决策支持任务）发展到能够整合诸如成像、文本和结构化数据等多种数据模态的多模态AI系统。这些技术的多样化景观以及不断增加的兴趣表明，对它们的应用和潜力进行全面回顾的需求。本综述探讨了多模态AI的发展演变，突出了其方法、应用、数据集及其在临床环境中的评估。根据PRISMA-ScR指南，我们系统地查询了PubMed、IEEE Xplore和Web of Science，优先考虑截至2024年底发表的最新研究。经过严格的筛选，共有144篇论文被纳入，揭示了这一动态领域的关键趋势和挑战。我们的研究结果强调了从单模态到多模态方法的转变，推动了诊断支持、医学报告生成、药物发现和对话式AI方面的新创新。然而，仍然存在关键挑战，包括异质数据类型的整合、提高模型可解释性、解决伦理问题以及在真实世界临床环境中验证AI系统。本综述总结了当前的技术状态，指出了关键的缺口，并提供了指导，以促进可扩展、可信赖且在医疗保健中具有临床影响力的多模态AI解决方案的发展。

发布时间: 2/14/2025

查看原文

混合答案集编程：基础与应用

作者: Nicolas R\"uhling

arXiv:2502.09235v1 宣布类型: 新摘要: 有序集编程(ASP)是一种解决现实世界问题的强大工具。然而，许多问题涉及数值和超出标准ASP求解器能力的复杂约束。通过使用特定约束的专门方法，像CLINGCON和CLINGO[DL]这样的混合求解器解决了这一问题。然而，这些求解器缺乏坚实的理论基础。这个问题最初通过引入将约束逻辑(HT\_c)作为逻辑Here-and-There(HT)及其非单调扩展平衡逻辑的扩展来解决。如今，HT作为ASP的逻辑基础，帮助扩展了对该范式的理解。其思想是，HTC（和其他扩展）在混合ASP中发挥类似的作用。关于这些逻辑的基本特征以及它们在求解器中的实际应用（例如，如何指导实现），仍有许多待解决的问题。对这些混合逻辑的正式理解也对于更好地理解它们所应用于的实际问题的内在结构至关重要，并有助于改进它们在ASP中的表示。作为ASP应用的一个示例，我们使用产品配置。

发布时间: 2/14/2025

查看原文

常识推理辅助的自主车辆系统

作者: Keegan Kimbrell (University of Texas at Dallas)

arXiv:2502.09233v1 Announce Type: 新摘要： Autonomous Vehicle (AV) 系统在很大程度上依赖于机器学习技术进行开发。虽然诸如深度学习等机器学习方法在涉及观察和分类的任务中极为有效，但在执行道路情景上的高级推理时却显得力不从心。这项研究旨在通过结合使用图像数据的常识推理模型来改进 AV 系统。这将使 AV 系统能够进行更加精确的推理，同时使它们更具可调整性、可解释性和伦理性。本文将讨论迄今为止的研究发现，并展望其未来方向。

发布时间: 2/14/2025

查看原文

动态回答集程序设计的计算方法

作者: Susana Hahn (University of Potsdam, Germany)

arXiv:2502.09228v1 动态类型：新摘要：在我们的日常生活中以及工业环境中，我们经常遇到需要时间推理和度量约束的动态问题。这些问题包括调度、路径规划和生产顺序安排等任务。动态逻辑传统上可以解决这些需求，但往往缺乏灵活且全面的问题建模能力。本研究旨在将强大的声明式问题求解方法回答集编程（ASP）扩展到有效地处理动态领域。通过将动态、时间逻辑和度量逻辑的概念整合进ASP，我们希望开发出能够有效建模复杂动态问题并进行高效推理的 robust 系统，从而增强ASP在工业环境中的应用性。

发布时间: 2/14/2025

查看原文

基于ASP生成因果合规的反事实解释

作者: Sopam Dasgupta (The University of Texas at Dallas, USA)

arXiv:2502.09226v1 宣告类型: 新摘要: 本研究专注于生成可实现的反事实解释。给定由机器学习模型或决策系统计算出的负面结果，novel CoGS 方法生成 (i) 一个代表正面结果的反事实解决方案和 (ii) 一条将我们从负面结果引导至正面结果的路径，其中路径中的每个节点代表一个属性（特征）值的变化。CoGS 计算遵守特征间因果约束的路径。因此，CoGS 计算出的反事实是现实的。CoGS 利用基于规则的机器学习算法来建模特征之间的因果依赖关系。论文讨论了研究的当前状态以及初步获得的结果。

发布时间: 2/14/2025

查看原文

有序排序的意向逻辑：借助类型断言和概念量化表达子类型泛化

作者: {\DJ}or{\dj}e Markovi\'c, Marc Denecker

arXiv:2502.09224v1 通告类型: 新摘要: 子类型化，也称为子类型多态性，是编程语言理论中广泛研究的概念，用于定义不同类型之间的替换关系。这一特性确保了为超类型对象设计的程序与它们的子类型保持兼容。在本文中，我们探讨了有序排序逻辑在知识表示领域利用这些概念的能力。我们认识到两个基本限制：首先，这种逻辑无法处理非逻辑符号的概念而仅处理其值；其次，缺乏用于限制项类型的语言构造。因此，我们提出了一种受保护的有序排序意向性逻辑，其中受保护是用于标注类型信息的语言构造，意向性逻辑则提供了对概念进行量化的支持。

发布时间: 2/14/2025

查看原文

基于ASP驱动的用户与Clinguin的交互

作者: Alexander Beiser, Susana Hahn, Torsten Schaub

arXiv:2502.09222v1 通告类型: 新增摘要: 我们介绍了clinguin，一个基于ASP的用户界面设计系统。Clinguin通过让ASP开发人员直接在ASP中构建交互原型来简化用户界面的开发，从而免去使用单独的前端语言的需要。为了实现这一目标，clinguin使用了几条专门的谓词来定义用户界面和用户触发的事件的处理方式。这种简单的设计极大地促进了对ASP系统（我们的情况是clingo）中用户交互的规范说明。

发布时间: 2/14/2025

查看原文