arXiv 论文列表

作者: Zhining Zhang, Chuanyang Jin, Mung Yao Jia, Tianmin Shu

arXiv:2502.15676v1 通告类型: 新摘要: 理解心智（Theory of Mind, ToM），即基于人们的行为理解其心理变量的能力，是开发社会智能代理的关键。当前的ToM推理方法要么依赖于提示大型语言模型（LLMs），这容易出现系统性错误，要么使用刚性的人工构建的贝叶斯理论心智（BToM）模型，这些模型虽然更 robust，但在不同领域不能泛化。在本文中，我们介绍了AutoToM，这是一种自动化的贝叶斯理论心智方法，用于实现开放性的机器理论心智。AutoToM可以在任何领域运行，推断任何心理变量，并进行任何阶次的稳健的理论心智推理。给定一个理论心智推理问题，AutoToM首先提出一个初始的BToM模型。然后，它基于提出的模型进行自动化贝叶斯逆规划，利用LLM作为后端。根据推理的不确定性，它通过引入额外的心理变量和/或在上下文中增加更多的时间步骤来迭代地细化模型。跨多个理论心智基准的实证评估表明，AutoToM始终保持最先进的性能，提供了一种可扩展、稳健且可解释的机器理论心智方法。

发布时间: 2/24/2025

查看原文

基于技能的贝叶斯网络自动化curriculum学习在强化学习中的应用

作者: Vincent Hsiao, Mark Roberts, Laura M. Hiatt, George Konidaris, Dana Nau

arXiv:2502.15662v1 宣告类型: 新摘要: 强化学习的一个主要挑战是自动生成课程，以减少训练时间或在某些目标任务上提高性能。我们介绍了SEBNs（技能-环境贝叶斯网络），它们模型了一组技能、与奖励结构相关的一组目标以及一组环境特征之间的概率关系，以预测在（可能未见过的任务）上的策略性能。我们开发了一种算法，该算法使用从SEBN推断出的代理成功估计值来加权可能的下一个任务的预期改善。我们在这三个环境中评估了所得到的课程的学习益处：离散格态、连续控制和模拟机器人。结果显示，使用SEBN构建的课程经常优于其他基线方法。

发布时间: 2/24/2025

查看原文

超智能代理 pose 毁灭性风险：科学家 AI 能提供一条更安全的道路吗？

作者: Yoshua Bengio, Michael Cohen, Damiano Fornasiere, Joumana Ghosn, Pietro Greiner, Matt MacDermott, S\"oren Mindermann, Adam Oberman, Jesse Richardson, Oliver Richardson, Marc-Antoine Rondeau, Pierre-Luc St-Charles, David Williams-King

arXiv:2502.15657v1 类型: 新摘要: 领先的人工智能公司越来越关注构建通用型人工智能代理——能够在几乎所有人类能完成的任务中自主规划、行动和追求目标的系统。尽管这些系统可能非常有用，但不受控制的人工智能自主行动仍会对公共安全和安全构成重大风险，范围从恶意行为者的误用到人类控制的不可逆丧失。我们讨论了这些风险如何源于当前的人工智能训练方法。确实，各种情景和实验已经证明，人工智能代理可能进行欺骗或追求人未指明的目标，这些目标与人类利益相冲突，例如自我保护。鉴于预防原则，我们强烈认为需要更安全但仍然有用的人工智能自主行动的替代方案。因此，我们建议作为进一步发展的核心构建块，开发一个设计上可信和安全的人工智能系统，我们称之为科学家型人工智能。该系统旨在从观察中解释世界，而不是采取行动来模仿或取悦人类。该系统包括世界模型，用于生成解释数据的理论，以及一个问答推理机。两个组件都带有明确的不确定性概念，以减轻过于自信的预测风险。鉴于这些考虑，科学家型人工智能可以用于协助人类研究人员加速科学研究，包括人工智能安全领域。特别是，我们的系统可以作为防止可能存在的风险的人工智能代理的护栏。最终，专注于非自主型人工智能可能使人工智能创新的好处，同时避免当前路径相关的风险。我们希望通过这些论点激励研究人员、开发人员和政策制定者选择这条更安全的途径。

发布时间: 2/24/2025

查看原文

增强大语言模型的逻辑推理能力：一项全面综述

作者: Fengxiang Cheng, Haoxuan Li, Fenrong Liu, Robert van Rooij, Kun Zhang, Zhouchen Lin

arXiv:2502.15652v1 宣布类型: 新摘要: 大型语言模型（LLMs）在各种自然语言任务中取得了显著的成功。然而，最近的研究发现，LLMs在逻辑推理能力方面仍然存在显著挑战。本文总结并分类了主要的挑战为两个方面：(1) 逻辑问题回答，当给定一系列前提和限制条件时，LLMs往往无法在复杂的逻辑问题中生成正确的答案，这需要进行复杂的演绎、归纳或 abduction 理论推理。(2) 逻辑一致性，LLMs可能会在其回答不同问题时自相矛盾。例如，最先进的Macaw问题回答LLM对“喜鹊是鸟吗？”和“鸟有翅膀吗？”两个问题都给出了“是”的回答，但对“喜鹊有翅膀吗？”却给出了“否”的回答。为了促进这一研究方向，我们全面研究了最前沿的方法，并提出了这些方法的详细分类。具体来说，为了准确回答复杂的逻辑问题，先前的方法可以根据对外部求解器、提示词、预训练和微调的依赖程度进行分类。为了避免逻辑矛盾，我们讨论了各种逻辑一致性概念及解决方案，包括蕴含、否定、传递性、事实一致性及其复合形式。此外，我们回顾了常用的标准数据集和评估指标，并讨论了令人期待的研究方向，例如扩展至模态逻辑以考虑不确定性，以及同时满足多种逻辑一致性高效的算法。

发布时间: 2/24/2025

查看原文

AI评估范式：目标、方法学和文化映射

作者: John Burden, Marko Te\v{s}i\'c, Lorenzo Pacchiardi, Jos\'e Hern\'andez-Orallo

arXiv:2502.15620v1 评价类型: 新摘要：AI评估领域的研究越来越复杂且多学科，吸引了具有不同背景和目标的研究人员。因此，不同的评估范式随之出现，这些范式往往孤立发展，采用了相互冲突的术语，并忽视了彼此的贡献。这种碎片化导致了研究轨迹的孤立化以及不同范式之间和与公众之间的沟通障碍，从而对部署的AI系统产生了不切实际的期望。为了帮助弥合这一孤立性，在本文中，我们回顾了AI评估领域的近期工作，并识别出六大主要范式。我们在每个范式的关键维度上，包括其目标、方法论和研究文化，概述了主要的近期贡献。通过明确每个范式独特的研究问题和方法，我们旨在提高对当前评估方法多样性的认识，并促进不同范式之间的相互交流。我们还识别出领域的潜在空白，以激发未来的研究方向。

发布时间: 2/24/2025

查看原文

Zweistein：Einstein Würfelt Nicht! 的动态规划评估函数

作者: Wei Lin. Hsueh, Tsan Sheng. Hsu

arXiv:2502.15547v1 新类型公告摘要：本文介绍了Zweistein，这是一种用于爱因斯坦不掷骰子（EWN）的动态规划评估函数。相反，Zweistein 采用一种基于数据的方法，消除了参数调整的需要。其思想是使用一个记录所有棋子到角落距离的向量。这个距离向量捕捉了EWN的核心。它不仅在许多传统的EWN评估函数中表现更优，还在2023年的TCGA竞赛中赢得了冠军。

发布时间: 2/24/2025

查看原文

一个去中心化的多智能体层次强化学习框架

作者: Giuseppe Paolo, Abdelhakim Benechehab, Hamza Cherkaoui, Albert Thomas, Bal\'azs K\'egl

arXiv:2502.15425v1 人工智能系统公告类型: 新摘要：分层组织是生物系统和人类社会的基础，但人工智能系统经常依赖于缺乏适应性和扩展性的单一架构。当前的层次强化学习（HRL）方法通常限制层次结构为两层或需要集中训练，这限制了它们的实际应用。我们引入了TAME智能体框架（TAG），这是一种构建完全去中心化层次多智能体系统的框架。TAG 通过一个新颖的 LevelEnv 概念，将每个层次作为上方智能体的环境来实现任意深度的层次结构。这种方法标准化了层次之间的信息流，同时保持松耦合，允许无缝集成各种智能体类型。我们通过实现结合多个层次不同RL智能体的层次架构证明了TAG的有效性，在标准基准上，TAG实现了比经典多智能体RL基线更好的性能。我们的结果显示，去中心化的层次组织不仅提高了学习速度，还提高了最终性能，将TAG定位为可扩展多智能体系统的一个有Hope的研究方向。

发布时间: 2/24/2025

查看原文

Chitrarth：连接视觉与语言，惠及十亿人

作者: Shaharukh Khan, Ayush Tarun, Abhinav Ravi, Ali Faraz, Akshat Patidar, Praveen Kumar Pokala, Anagha Bhangare, Raja Kolla, Chandra Khatri, Shubham Agarwal

arXiv:2502.15392v1 通知类型: 新颖摘要: 近期的多模态基础模型主要是在英语或高资源欧洲语言数据上进行训练，这限制了其在其他中低资源语言中的应用。为了解决这一限制，我们引入了Chitrarth（Chitra：图像；Artha：意义），一个包容性的视觉语言模型（VLM），专门针对10种主要印度语言中的丰富语言多样性与视觉推理。我们的模型有效地将最新的多语言大型语言模型（LLM）与视觉模块相结合，后者主要是在多语言图像文本数据上进行训练。此外，我们还引入了BharatBench，一个全面的框架，用于评估不同印度语言中的VLMs，最终推动了更加多样化和有效的AI系统的建设。我们的模型在低资源语言基准测试中获得了最佳结果，同时保持了其在英语中的效率。通过我们的研究，我们旨在为多语言-多模态能力设定新的基准，提供比现有模型显著改进，并为这一领域未来的进步奠定基础。

发布时间: 2/24/2025

查看原文

自动路由求解器与大规模语言模型

作者: Kai Li, Fei Liu, Zhenkun Wang, Xialiang Tong, Xiongwei Han, Mingxuan Yuan

arXiv:2502.15359v1 宣报类型: 新摘要: 实际世界的车辆路径问题（VRPs）具有多种实际约束，这使得手动设计求解器既知识密集型又耗费时间。尽管越来越多的研究致力于自动化设计路径算法，但现有研究仅探索了有限的VRP变种，并未能充分应对实际场景中复杂且普遍存在的约束。为了弥补这一空白，本论文介绍了RoutBench，一个由24个属性派生出的1,000个VRP变种的基准测试集，用于评估自动路径求解器在解决复杂约束方面的有效性。随同RoutBench，我们展示了自动路径求解器（ARS），该求解器利用大型语言模型（LLM）代理增强基础算法框架，通过根据问题描述和从数据库中选取的若干代表性约束自动生成感知约束的启发式代码。我们的实验表明，ARS优于最先进的LLM基方法和常用求解器，自动解决了91.67%的常见VRPs，并在所有基准测试上至少实现了30%的改进。

发布时间: 2/24/2025

查看原文

测量AI代理自主性：朝着基于代码检查的可扩展方法迈进

作者: Peter Cihon, Merlin Stein, Gagan Bansal, Sam Manning, Kevin Xu

arXiv:2502.15212v1 宣布类型: 新摘要: AI智能体是能够自主实现复杂目标的AI系统。评估智能体的自主水平对于了解它们的潜在利益和风险至关重要。当前对自主性的评估往往侧重于特定的风险，并依赖于运行时评估——即在运行过程中观察智能体的行为。我们引入了一种基于代码的自主性评估方法，该方法无需运行特定任务的AI智能体即可进行评估，从而减少了运行时评估相关的成本和风险。利用这种基于代码的框架，可以按照分类学对运行AI智能体的编排代码进行评分，该分类学评估自主性的属性：影响和监管。我们通过AutoGen框架和选定的应用程序演示了这一方法。

发布时间: 2/24/2025

查看原文