arXiv 论文列表

作者: Ron Benchetrit, Idan Lev-Yehudi, Andrey Zhitnikov, Vadim Indelman

arXiv:2502.02549v1 宣告类型: 新摘要: 部分可观测马尔可夫决策过程(POMDPs)为在自主驾驶和机器人探索等应用中做出在不确定性下的决策提供了稳健的框架。其扩展形式$\rho$POMDPs引入了信念依赖的奖励，这使得关于不确定性进行了明确的推理成为可能。现有的针对连续空间的在线$\rho$POMDP求解器依赖于固定信念表示，限制了其适应性和改进能力——这对于信息收集等任务来说是至关重要的。我们提出了一个任何时间( anytime)求解器$\rho$POMCPOW，它能够动态改进信念表示，并且具有随着时间推移改进的正式保证。为了缓解更新信念依赖的奖励所导致的高计算成本，我们提出了一种新颖的增量计算方法。我们展示了该方法对于常见的熵估计器的有效性，计算成本减少了几个数量级。实验结果表明，$\rho$POMCPOW 在效率和解决问题的质量上都优于现有的最佳求解器。

发布时间: 2/5/2025

查看原文

面向凸优化问题证明可解性的图神经网络

作者: Chendi Qian, Christopher Morris

arXiv:2502.02446v1 宣布类型: 新颖摘要: 近期，消息传递图神经网络（MPNNs）因其捕捉变量约束交互的能力，在解决组合优化和连续优化问题方面展示了潜力。虽然现有的方法利用MPNNs来近似解决方案或作为传统求解器的预热器，但在凸优化设置中，它们经常缺乏可行性保证。在这里，我们提出了一种迭代MPNN框架，以具有可证明的可行性保证来解决凸优化问题。首先，我们证明MPNNs可以证明地模拟标准的内部点方法，用于求解具有线性约束的二次问题，涵盖了诸如SVMs的相关问题。其次，为了确保可行性，我们引入了一种从可行点开始的变体，并在可行区域内逐步限制搜索。实验结果表明，我们的方法在解决方案质量和可行性方面优于现有的神经基线模型，在某些情况下，还比最先进的求解器（如Gurobi）实现了更快的求解时间，并且能很好地泛化到未见过的问题规模。

发布时间: 2/5/2025

查看原文

一种最小最大方法的即兴团队合作策略

作者: Victor Villin, Thomas Kleine Buening, Christos Dimitrakakis

arXiv:2502.02377v1 通告类型: 新摘要: 我们提出了一种最小最大-贝叶斯方法来优化即兴团队合作(AHT)，以在部署时对合作伙伴的先验分布考虑对手情况，从而优化策略。与现有方法假设特定的合作伙伴分布不同，我们的方法提高了最坏情况下的性能保证。广泛的实验，包括对由Melting Pot套件中的协同烹饪任务进行的评估，显示了我们的方法在鲁棒性方面优于自博弈、虚构博弈和最佳反应学习。我们的工作突显了选择合适的团队成员训练分布对于在即兴团队合作(AHT)中实现鲁棒性的重要性。

发布时间: 2/5/2025

查看原文

elicitation 游戏：评估能力 elicitation 技术

作者: Felix Hofst\"atter, Teun van der Weij, Jayden Teoh, Henning Bartsch, Francis Rhys Ward

arXiv:2502.02180v1 宣告类型: 新颖摘要：能力评估对于理解并监管可能部署或进一步发展的AI系统至关重要。因此，评估需要提供AI系统能力的准确估计。然而，在许多情况下，模型中原本隐藏的能力在初始发布后很长时间才被激发出来。因此，已经做出了大量的努力来开发从模型中激发隐藏能力的方法。在本文中，我们通过故意训练模型有机体——带有隐藏能力的语言模型，这些能力可以通过密码揭示，来评估能力激发技术的有效性。我们基于断路的方法介绍了一种新的模型有机体训练方法，这种方法比标准的密码锁定模型更能抵御激发技术。我们专注于基于提示和激活引导的激发技术，并将其与微调方法进行比较。提示技术可以在MCQA设置中激发密码锁定和断路模型有机体的实际能力，而引导则无法做到这一点。对于代码生成任务，只有微调能够激发我们新型模型有机体的隐藏能力。此外，我们的结果表明，结合技术可以提高激发效果。不过，如果可能的话，微调应是提高能力评估可信度的方法选择。

发布时间: 2/5/2025

查看原文

安全性对齐的语言模型的漏洞缓解 via 去偏见

作者: Thien Q. Tran, Akifumi Wachi, Rei Sato, Takumi Tanabe, Youhei Akimoto

arXiv:2502.02153v1 安全对齐类型: 新颖摘要: 安全对齐是实际人工智能应用中一个至关重要的研究课题。尽管人工智能中的安全性和可信度具有多方面性，当前的安全对齐方法通常集中在全面的安全概念上。通过仔细评估现有的安全对齐方法中的模型，我们发现，尽管它们通常提高了整体的安全性能，但在特定类别中未能确保安全。我们的研究首先揭示了在不牺牲模型的帮助性的情况下消除这些漏洞的难度。我们观察到，虽然较小的KL惩罚参数、增加的训练迭代次数和数据集清理可以提高安全性，但它们并不一定能改善安全性和帮助性之间的权衡。我们发现，安全对齐甚至可能引起不良影响，导致模型更倾向于生成负面标记，从而产生拒绝性的响应，而不考虑输入的上下文。为了解决这个问题，我们引入了一种无需学习的方法——标记级安全去偏推断（TSDI），在生成过程中使用随机构造的提示来估计和纠正这种偏差。我们的实验表明，我们的方法可以在保持安全性的前提下增强模型的帮助性，从而改善权衡前沿。

发布时间: 2/5/2025

查看原文

带有大型语言模型的リスク farkındalı()) 注意：这里的“risk-aware”通常翻译为“风险意识的”或“风险管理的”，但由于受到英文标题结构的影响，我保持了“リスク farkındalı”这种不完全对应的翻译方式。正确的翻译应为“风险意识的驾驶场景分析”。

作者: Yuan Gao, Mattia Piccinini, Johannes Betz

arXiv:2502.02145v1 宣告类型: 新摘要: 大型语言模型（LLMs）能够捕捉细腻的上下文关系、推理和复杂的问题解决能力。通过利用它们处理和解释大规模信息的能力，LLMs 在应对特定领域的挑战方面展现了潜力，包括自动驾驶系统的挑战。本文提出了一种新的框架，该框架利用LLMs进行生成驾驶场景的风险感知分析。我们假设LLMs能够有效地评估自动驾驶测试模拟器生成的驾驶场景是否涉及安全性问题。为了验证这一假设，我们进行了经验评估，以评估LLMs在执行此任务时的有效性。该框架还将通过使用对抗方法修改现有非关键场景并测试其在验证运动规划算法方面的有效性，来提供反馈生成新的关键安全场景。代码和场景可在以下链接获取：https://github.com/yuangao-tum/Riskaware-Scenario-analyse

发布时间: 2/5/2025

查看原文

标准神经计算本身不足以实现逻辑智能

作者: Youngsung Kim

arXiv:2502.02135v1 宣告类型: 新摘要: 当前设计的神经网络未能实现真正的逻辑智能。现代AI模型依赖于基于标准神经计算的内积变换和非线性激活函数来从数据中近似模式。虽然这种方法在归纳学习中效果良好，但这种架构缺乏进行演绎推理和逻辑一致性所需的结构保证。因此，深层网络在没有大量事后修改的情况下难以处理基于规则的推理、结构化泛化和可解释性。本文观点认为，标准神经层必须从根本上重新思考，以整合逻辑推理。我们提倡使用逻辑神经单元（LNUs）——这些是模块化的组件，能够直接在神经架构中嵌入可微分的逻辑操作近似（例如AND、OR、NOT）。我们批评现有的神经符号方法，指出现有神经计算方法在逻辑推理方面的局限性，并将LNUs作为AI研究中必要的范式转变。最后，我们概述了实施路线图，讨论了理论基础、架构整合和未来研究的关键挑战。

发布时间: 2/5/2025

查看原文

受限层次多智能体 reinforcement 学习：可持续海运物流

作者: Saad Alqithami

arXiv:2502.02060v1 通知类型: 新摘要: 应对全球挑战，如温室气体排放和资源不平等，需要先进的基于人工智能的自主代理协调。我们提出了一种新的框架CH-MARL（Constrained Hierarchical Multiagent Reinforcement Learning，受限层级多智能体强化学习），该框架结合了层级决策制定与动态约束执行以及公平意识的奖励塑造。CH-MARL 使用实时约束执行层以确保遵守全球排放限制，同时整合了公平性指标，以促进资源在代理之间的公平分配。在仿真实际物流环境中的实验表明，CH-MARL 显著减少了排放，并提高了公平性和运营效率。除了在特定领域的成功外，CH-MARL 还提供了一种在受限和动态环境中多智能体协调挑战的可扩展和可泛化的解决方案，从而推动了强化学习的技术前沿。

发布时间: 2/5/2025

查看原文

使用分布式认知系统和进化策略构建认知孪生体

作者: Wandemberg Gibaut, Ricardo Gudwin

arXiv:2502.01834v1 交互类型: 新摘要: 本文介绍了一种使用输入-输出训练和基于分布认知架构的演化策略来构建交互式认知孪生（一种计算版本的外部代理）的技术。在这里，我们展示了通过端到端训练系统并呈现性能指标，可以协调许多简单的物理和虚拟设备，以达到对人体交互行为的良好近似。生成的认知孪生后来可以用于自动化任务、生成更具人类特征的虚拟代理，或者进一步研究其行为。

发布时间: 2/5/2025

查看原文

具有代理人工智能的工作流在检测现实世界数据中的认知问题

作者: Jiazi Tian, Liqin Wang, Pedram Fard, Valdery Moura Junior, Deborah Blacker, Jennifer S. Haas, Chirag Patel, Shawn N. Murphy, Lidia M. V. R. Moura, Hossein Estiri

arXiv:2502.01789v1 宣告类型: 新摘要: 早期识别认知问题至关重要，但往往受到症状表现细微的限制。本研究开发并验证了一个完全自动化、多代理的人工智能工作流，使用LLaMA 3 8B来识别马萨诸塞州综合医院Brigham部分3,338份临床笔记中的认知问题。利用针对特定任务的代理动态合作，从临床笔记中提取有意义的洞察，该工作流与以专家为主导的基准进行了比较。两个工作流均实现了高水平的分类性能，F1分数分别为0.90和0.91。多代理工作流在特异性方面表现出改进（1.00），并在更少的迭代中实现了即时细化。虽然两个工作流在验证数据上的性能有所降低，但多代理工作流保持了完美的特异性。这些发现凸显了完全自动化的多代理人工智能工作流在更高效率下达到专家级准确性的潜力，为临床环境中检测认知问题提供了可扩展且成本效益高的解决方案。

发布时间: 2/5/2025

查看原文