arXiv:2505.05029v1 宣布类型: 新
摘要: 公地悲剧, 个体自私导致集体灾难性后果, 是人类社会普遍面临的挑战。最近的研究表明, 类似的现象可以在生成型多代理系统(MASs)中出现。为了解决这一挑战, 本文探讨了使用声誉系统的解决方案。我们提出了一个动态的、多层次的声誉框架RepuNet, 导入了代理层面的声誉动态和系统层面的网络进化模型。具体而言, 在直接交互和间接谣言的驱动下, 代理为自己和同伴建立声誉, 并决定是否与其他代理建立或断开连接以供未来交互。通过两种不同的场景, 我们展示了RepuNet有效缓解了‘公地悲剧’, 促进了并维持了生成型MASs中的合作。此外, 我们发现声誉系统可以在生成型MASs中引起丰富的涌现行为, 如合作集群的形成、剥削性代理的社会孤立以及更倾向于传播正面谣言而不是负面谣言。
arXiv:2505.04997v1 宣布类型: 新
摘要:计算流体动力学(CFD)是各个工程学科中的一项关键模拟工具,但通常需要大量的领域专业知识和手动配置,从而形成了进入壁垒。我们介绍了泡沫-代理,这是一个多代理框架,可以从自然语言输入自动实现基于OpenFOAM的复杂CFD模拟工作流。我们的创新包括:(1) 一个分层多索引检索系统,针对不同模拟方面具有专门的索引;(2) 一个具有依赖性意识的文件生成系统,它在配置文件之间提供了一致性管理;以及(3) 一个迭代式错误校正机制,可以在不需要人工干预的情况下诊断并解决模拟失败。在包含110个模拟任务的数据集上的全面评估表明,泡沫-代理使用Claude 3.5 Sonnet实现了83.6%的成功率,显著优于现有框架(MetaOpenFOAM为55.5%,OpenFOAM-GPT为37.3%)。消融研究证明了每个系统组件的关键贡献,专门的错误校正机制提供了36.4%的性能改进。泡沫-代理显著降低了CFD的专业知识门槛,同时保持了建模准确性,展示了专门化的多代理系统为复杂科学仿真工具普及访问带来的潜力。该代码可以在https://github.com/csml-rpi/Foam-Agent获取。
arXiv:2505.04966v1 评审类型: 新作
摘要:随着提交论文数量的大幅增加(每个会场超过10,000篇提交),主要人工智能(AI)会议的同行评审过程面临着前所未有的挑战,同时审查质量以及评审员责任的问题日益引起关注。本文呼吁需要将传统的单向评审系统转变为双向反馈循环,其中作者评估评审质量,评审员获得正式认证,从而建立一个促进可持续、高质量同行评审系统的问责框架。当前的评审系统可以视为作者、评审员和系统(即会议)之间的互动,在这里我们提出所有三方面都应对当前问题负有责任。然而,作者的问题只能通过政策实施和检测工具来解决,伦理问题只能通过自我反思来纠正。因此,本文重点在于通过两种关键机制改革评审员的问责制并系统性地给予奖励:(1)两级双向评审系统,让作者评估评审意见同时尽量减少反报复行为,(2)一个系统的评审员奖励系统,通过激励高质量的评审来提高评审员的积极性。我们恳请社区对这些问题以及所需的改革表现出强烈兴趣,以增强同行评审过程。
arXiv:2505.04950v1 宣告类型: 新
摘要: 尽管人工智能在生成模型和大语言模型等领域取得了令人印象深刻的成绩,但在处理不确定性并将知识应用于训练数据之外的领域方面,人工智能的能力仍然存在显著差距。我们arg声称,在自主系统中,人工智能模型在面对不熟悉或敌对的数据时无法做出稳健的预测,这一点可以从自动驾驶车辆事件中得到证明。传统的机器学习方法由于过分强调数据拟合和领域适应,难以解决这些问题。本文提出了从知之甚少的角度转变范式的观点,强调模型不仅应从已知知识中学习,而且应从无知中学习。这一侧重于识别和管理不确定性的方法,提供了一种提高人工智能系统韧性和稳健性的潜在解决方案,确保它们能够更好地应对不可预测的实际环境。
arXiv:2505.04927v1 宣布类型: 新
摘要: 我们将信念过滤作为人工代理元认知控制的一种机制进行了研究,重点关注以语言表达形式表示的内部认知状态的调节。这项机制在语义流形框架内发展起来,其中信念状态是自然语言片段的动态、结构化集合。信念过滤器作为这些片段在各种认知过渡中的内容感知操作起作用。本文展示了这样一种以语言为基础的认知架构的固有可解释性和模块性直接支持信念过滤的方式,为代理调节提供了原则性的方法。该研究突出了通过结构化的干预手段在代理内部语义空间中增强AI安全性与对齐的可能性,并指出了嵌入式认知治理的新方向。
arXiv:2505.04914v1 宣言类型: 新
摘要:Transformer解码器语言模型是文本生成型人工智能的核心创新。这些模型正在被部署为许多应用中的通用智能系统。它们的实用性在于能够理解自然语言指令,并利用人类文本数据中嵌入的推理能力来应用于各种新任务。为了理解这种生成推理方法的局限性,我们主张需要考虑这些系统的设计约束。通过考虑transformer解码器模型的潜在变量结构,我们可以设计出能够探测其推理能力边界的任务。我们提出了一种开源库enigme,用于生成基于文本的谜题,这些谜题可用于训练和评估transformer解码器模型及未来AI架构中的推理能力。
arXiv:2505.04851v1 宣告类型: new
摘要: 尽管流行的文本到图像生成模型在处理国际和通用文化查询方面表现出色,但在处理个体文化方面存在显著的知识空白。这归因于现有大量网络收集的训练数据集,这些数据集主要基于西方欧洲或美国流行文化。同时,模型的文化适应性不足可能导致结果错误、生成质量下降以及刻板印象和冒犯性内容的传播。为了应对这一问题,我们研究了文化代码的概念,并认识到理解现代图像生成模型对该概念的重要性,这是目前研究社区尚未充分关注的问题。我们提出了收集和处理数据的方法,以形成基于文化代码的数据集,特别是俄罗斯文化代码。我们探讨了收集的数据如何影响国家领域内的生成质量,并使用Kandinsky 3.1文本到图像模型分析我们方法的有效性。人类评估结果表明,模型对俄罗斯文化的认知水平有所提高。
arXiv:2505.04843v1 安全事件响应类型:新
摘要:快速有效的事件响应对于预防对抗性网络攻击至关重要。自主网络防御(ACD)旨在通过人工智能(AI)代理自动化事件响应,这些代理规划并执行行动。大多数ACD方法侧重于单代理场景,并利用强化学习(RL)进行训练。然而,ACD RL训练的代理依赖于昂贵的训练,并且它们的推理并不总是可解释的或可转移的。大型语言模型(LLMs)可以通过提供一般安全背景下可解释的操作来解决这些问题。研究人员已经探索了LLM代理在ACD中的应用,但尚未在多代理场景中评估它们,或与其他ACD代理交互。在本文中,我们通过提出一种新的集成方式来CybORG CAGE 4环境,展示了LLMs在多代理ACD环境中的首次研究。我们通过提出一种新颖的通信协议来探讨ACD中的LLM和RL代理如何交互。我们的结果突显了LLMs和RL的优缺点,并帮助我们确定了创建、训练和部署未来ACD代理团队的有前途的研究方向。
arXiv:2505.04822v1 宣告类型: 新
摘要: 动作值在流行的行为强化学习(Reinforcement Learning, RL)模型中扮演着中心角色。然而,动作值是否明确表示的观点一直存在广泛的争论。因此,批评者反复建议应优先选择策略梯度(Policy Gradient, PG)模型而非基于值(Value-based, VB)模型,作为解决这一困境的一种可能方案。在这里,我们认为这种解决方案是令人满意的。这是因为PG方法实际上并不是“价值无关”的——尽管它们在执行时并不依赖明确表示的价值(刺激-响应映射),但在学习时却需要价值的表示。因此,切换到PG模型,本身不足以消除价值从行为模型中的作用。更广泛地说,要求进行价值的表示来自于标准RL框架提出的优化目标的假设,而不是所选择的具体算法来解决它。以往的研究大多在概念化或问题建模时默认了这些标准的RL假设,而争论的焦点是在用不同的方法优化它(即PG或VB)。我们认为,相反地,争论的焦点应该转向对底层建模假设的批判性评估。从实验的角度来看,这种评估尤为重要。事实上,当放松标准假设(如风险中立性、完全可观测性、马尔可夫环境、指数折现率)时,必须重考虑价值的概念,特别是在自然环境中。最后,我们使用价值的辩论作为案例研究,主张在认知科学中,构成“模型”的概念应该采用一种更细致、算法而非统计的角度。我们的分析表明,在评估模型的复杂性时,除了“参数化”的统计复杂性,还需要考虑计算复杂性等其他方面。
arXiv:2505.04736v1 通知类型: 新
摘要:智能辅导系统在教授形式命题逻辑证明方面表现出了有效性,但它们依赖于基于模板的解释,限制了它们提供个性化学生反馈的能力。虽然大规模语言模型(LLMs)在动态反馈生成方面表现出前景,但也可能产生 hallucinations 或教学上不恰当的解释。我们评估了 LLMs 在构建多步符号逻辑证明过程中的逐步准确性,比较了六种提示技术在四款最先进的 LLMs 上解决 358 个命题逻辑问题的表现。结果显示,DeepSeek-V3 在逐步证明构建方面表现最好,准确性为 84.4%,尤其在简单的规则方面表现尤为突出。我们进一步使用表现最好的 LLM 生成了 1,050 个独特的学生问题解决状态的解释性提示,并在 20% 的样本中根据 LLM 评分器和人类专家对 4 个标准的评价进行了评估。我们的分析发现,LLM 生成的提示整体准确率为 75%,并在一致性和清晰度方面受到了人类评估者的高度评价,但在解释提示为何提供以及其更大的上下文方面表现不佳。我们的结果表明,LLMs 可以用于增强具有逻辑辅导提示的辅导系统,但需要进行额外的修改以确保准确性和教学适宜性。