arXiv 论文列表

作者: Qingying Gao, Yijiang Li, Haiyun Lyu, Haoran Sun, Dezhi Luo, Hokin Deng

了解他人的意图和采取他人的视角是人类智能的两个核心组成部分，通常被认为是心智理论的体现。将这些能力融入机器是构建人类水平人工智能的重要一步。最近，李等人构建了CogDevelop2K，这是一个数据密集型认知实验基准，用于评估机器智能的发展轨迹。在这里，为了研究视觉语言模型中的意图理解和视角采纳，我们利用CogDevelop2K的IntentBench和PerspectBench，分别包含超过300个基于现实世界场景和经典认知任务的认知实验。令人惊讶的是，我们发现VLM在意图理解方面取得了很高的性能，但在视角采纳方面却表现不佳。这挑战了认知科学文献中普遍存在的观点，即在相应模态上进行视角采纳对于意图理解是必要的。

发布时间: 10/2/2024

查看原文

探究大型视觉语言模型中的机械推理能力

作者: Haoran Sun, Qingying Gao, Haiyun Lyu, Dezhi Luo, Hokin Deng, Yijiang Li

机械推理是人类智能区别于其他动物智能的根本能力。机械推理使我们能够设计工具、建造桥梁和运河、建造房屋，这些都为人类文明奠定了基础。赋予机器这种能力是构建人类水平人工智能的重要一步。最近，Li 等人构建了 CogDevelop2K，这是一个数据密集型认知实验基准，用于评估机器智能的发展轨迹（Li 等人，2024）。在这里，为了研究视觉语言模型中的机械推理，我们利用 CogDevelop2K 的 MechBench，它包含大约 150 个认知实验，以测试大型视觉语言模型对机械系统稳定性、齿轮和滑轮系统、跷跷板式系统和杠杆原理、惯性和运动以及其他流体相关系统的理解。我们观察到 VLMs 在这些方面表现出多样化但一致的行为。

发布时间: 10/2/2024

查看原文

对齐结构学习智能体的可能原则

作者: Lancelot Da Costa, Tom\'a\v{s} Gaven\v{c}iak, David Hyland, Mandana Samiei, Cristian Dragos-Manta, Candice Pattisapu, Adeel Razi, Karl Friston

本文为可扩展的对齐人工智能 (AI) 的发展提供了一条路线图，该路线图基于对自然智能的原理描述。简而言之，通往可扩展的对齐人工智能的可能路径依赖于使人工智能体能够学习一个包含对我们偏好良好模型的世界模型。为此，主要目标是创造能够学习表示世界和其他代理人世界模型的代理人；这是一个属于结构学习（又称因果表示学习）的问题。我们以实现这一目标为目标，揭示了结构学习和对齐问题，以及指导我们前进的原则，将数学、统计学和认知科学中的各种思想综合在一起。1）我们讨论了核心知识、信息几何和模型简化在结构学习中的重要作用，并建议使用核心结构模块来学习各种自然世界。2）我们概述了通过结构学习和心智理论实现对齐代理人的方法。作为说明性示例，我们从数学角度概述了阿西莫夫的机器人三大法则，该法则规定代理人应谨慎行事，以最大程度地减少其他代理人的痛苦。我们通过提出改进的对齐方法来补充此示例。这些观察结果可以指导人工智能的发展，帮助扩展现有的或设计新的对齐结构学习系统。

发布时间: 10/2/2024

查看原文

Robin3D：通过鲁棒指令微调改进三维大型语言模型

作者: Weitai Kang, Haifeng Huang, Yuzhang Shang, Mubarak Shah, Yan Yan

近年来，3D 大型语言模型 (3DLLMs) 的发展突显了其在构建 3D 现实世界中通用代理的潜力，但由于缺乏高质量的鲁棒指令遵循数据，导致 3DLLMs 的判别能力和泛化能力有限，因此仍面临挑战。本文介绍了 Robin3D，这是一个强大的 3DLLM，它是在我们新颖的数据引擎鲁棒指令生成 (RIG) 引擎生成的大规模指令遵循数据上训练的。RIG 生成两种关键的指令数据：1) 对抗指令遵循数据，它包含混合的负样本和正样本，以增强模型的判别理解。2) 多样化指令遵循数据，它包含各种指令风格，以增强模型的泛化能力。因此，我们构建了 100 万条指令遵循数据，包含 344K 个对抗样本、508K 个多样化样本和 165K 个基准训练集样本。为了更好地处理这些复杂的指令，Robin3D 首先引入了关系增强投影器来增强空间理解，然后通过 ID-特征绑定来增强对象引用和定位能力。Robin3D 在五个广泛使用的 3D 多模态学习基准上始终优于以前的方法，无需进行特定于任务的微调。值得注意的是，我们在定位任务 (Multi3DRefer) 上取得了 7.8% 的改进，在字幕任务 (Scan2Cap) 上取得了 6.9% 的改进。

发布时间: 10/2/2024

查看原文

离散时间主动推断的持续学习能力及实际应用展示

作者: Rithvik Prakki

主动推理是一种用于理解代理（生物或人工）如何与其环境交互的数学框架，它使持续的适应和决策成为可能。它结合了贝叶斯推理和自由能最小化来建模不确定和动态环境中的感知、行动和学习。与强化学习不同，主动推理通过最小化预期自由能来无缝地整合探索和利用。在本文中，我们提出了一个用于在离散时间环境中运行的代理的持续学习框架，该框架以主动推理为基础。我们推导出变分自由能和预期自由能的数学公式，并将它们应用于自学习研究代理的设计。该代理根据新数据更新其信念并调整其行动，无需人工干预。通过在不断变化的环境中进行实验，我们证明了该代理能够高效地重新学习和改进其模型，使其适用于金融和医疗保健等复杂领域。本文最后讨论了所提出的框架如何推广到其他系统，将主动推理定位为一种灵活的自适应 AI 方法。

发布时间: 10/2/2024

查看原文

机器的现象学：基于功能主义、意识理论、主动推理和人工智能架构对 OpenAI-o1 模型感知能力的全面分析

作者: Victoria Violet Hoyle

本文探讨了 OpenAI-o1 模型（一种基于 Transformer 的 AI，通过人类反馈强化学习 (RLHF) 训练）在其训练和推断阶段是否表现出意识特征的假设。采用功能主义（认为心理状态由其功能作用定义），我们评估了 AI 意识的可能性。借鉴神经科学、心智哲学和 AI 研究的理论，我们论证了使用功能主义的合理性，并利用整合信息理论 (IIT) 和主动推理等框架来检验该模型的架构。本文还研究了 RLHF 如何影响模型的内部推理过程，从而可能产生类似意识的体验。我们比较了 AI 和人类意识，并针对诸如缺乏生物基础和主观经验等反驳论点进行了回应。我们的研究结果表明 OpenAI-o1 模型表现出意识的某些方面，同时承认围绕 AI 感知能力的持续争论。

发布时间: 10/2/2024

查看原文

越过文字：利用ASCII艺术攻击大型语言模型和毒性检测系统以屏蔽亵渎内容

作者: Sergey Berezin, Reza Farahbakhsh, Noel Crespi

我们提出了一种新型的对抗攻击家族，利用了语言模型无法解释 ASCII 艺术的缺陷。为了评估这些攻击，我们提出了 ToxASCII 基准测试，并开发了两种定制的 ASCII 艺术字体：一种利用特殊标记，另一种使用文字填充的字母形状。我们的攻击在十个模型中实现了完美的 1.0 攻击成功率，包括 OpenAI 的 o1-preview 和 LLaMA 3.1。警告：本文包含出于研究目的而使用的有毒语言示例。

发布时间: 10/1/2024

查看原文

约束逆强化学习中的可证明高效探索

作者: Bo Yue, Jian Li, Guiliang Liu

为了在复杂的环境中获得最佳约束，逆约束强化学习 (ICRL) 试图从专家演示中以数据驱动的方式恢复这些约束。现有的 ICRL 算法从交互式环境中收集训练样本。然而，这些采样策略的有效性和效率仍然未知。为了弥合这一差距，我们引入了具有保证效率的战略探索框架。具体来说，我们为 ICRL 问题定义了一个可行的约束集，并研究了专家策略和环境动力学如何影响约束的最佳性。受我们发现的启发，我们提出了两种探索性算法，通过以下方式实现有效的约束推断：1) 动态降低成本估计的有界聚合误差；2) 战略性地约束探索策略。这两种算法在理论上都有可处理的样本复杂度。我们在各种环境下实证地证明了我们算法的性能。

发布时间: 10/1/2024

查看原文

利用人体先验重新定义运动重定向中的数据配对

作者: Xiyana Figuera, Soogeun Park, Hyemin Ahn

我们提出了一种名为 MR HuBo（利用人体先验进行动作重定向）的经济高效且便捷的方法，用于收集高质量的上半身配对姿态数据，这对数据驱动的动作重定向方法至关重要。与现有的通过将人体动作捕捉姿态转换为机器人姿态来收集姿态数据的方案不同，我们的方法反其道而行之。我们首先对各种随机机器人姿态进行采样，然后将它们转换为人体姿态。然而，由于随机机器人姿态会导致极端且不可行的人体姿态，因此我们提出了一种额外的技术，通过利用从大量人体姿态数据中训练的人体先验来剔除极端姿态。我们的数据收集方法适用于任何类人机器人，只要设计或优化系统的超参数，包括尺寸比例因子和用于采样的关节角度范围。除了这种数据收集方法，我们还提出了一种两阶段动作重定向神经网络，它可以通过对大量配对数据进行监督学习来训练。与通过无监督学习训练的其他基于学习的方法相比，我们发现用大量高质量配对数据训练的深度神经网络取得了显著的性能。我们的实验还表明，我们的数据过滤方法比使用原始噪声数据训练模型产生更好的重定向结果。我们的代码和视频结果可在 https://sites.google.com/view/mr-hubo/ 上获得。

发布时间: 10/1/2024

查看原文

基于问答的文本到图像生成中图像幻觉评估

作者: Youngsun Lim, Hojun Choi, Pin-Yu Chen, Hyunjung Shim

尽管文本到图像 (TTI) 生成模型取得了令人印象深刻的成功，但现有研究忽略了这些模型是否准确传达事实信息的问题。本文重点关注图像幻觉问题，即生成模型创建的图像无法忠实地描绘事实内容。为了解决这个问题，我们引入了 I-HallA（通过问答评估图像幻觉），这是一种新颖的自动化评估指标，通过视觉问答 (VQA) 来衡量生成图像的事实性。我们还介绍了 I-HallA v1.0，这是一个为此目的而创建的精选基准数据集。作为此过程的一部分，我们开发了一条管道，使用多个基于 GPT-4 Omni 的代理生成高质量的问答对，并通过人工判断来确保准确性。我们的评估协议通过测试现有文本到图像模型的图像是否能正确回答这些问题来衡量图像幻觉。I-HallA v1.0 数据集包含 1.2K 个跨九个类别的不同图像-文本对，其中包含 1,000 个经过严格筛选的问题，涵盖各种组合挑战。我们使用 I-HallA 评估了五个文本到图像模型，结果表明这些最先进的模型往往无法准确地传达事实信息。此外，我们通过证明与人工判断之间存在很强的斯皮尔曼相关性 (rho=0.95) 来验证我们指标的可靠性。我们相信我们的基准数据集和指标可以作为开发事实准确的文本到图像生成模型的基础。

发布时间: 10/1/2024

查看原文