arXiv 论文列表

作者: Yan Huang, Wei Liu, Xiaogang Zang

搜索空间日益复杂和高维化，会对模糊规则分类器的归纳学习产生负面影响，从而影响模糊系统的可扩展性和准确性。本研究针对糖尿病分类的挑战，利用脑风暴优化 (BSO) 算法提出了一种新颖的模糊系统，重新定义了该场景下的规则生成。将指数模型集成到标准 BSO 算法中，以增强规则推导，专门针对糖尿病相关数据。然后将这种创新的模糊系统应用于涉及糖尿病数据集的分类任务，实验表明分类精度有显著提高。

发布时间: 10/3/2024

查看原文

烤箱调度问题的理论下界

作者: Francesca Da Ros, Marie-Louise Lackner, Nysret Musliu

烤箱调度问题（OSP）是一个在半导体行业出现的 NP 难现实世界并行批处理调度问题。该问题的目标是在多个烤箱上调度一组作业，同时最小化多个因素，即总烤箱运行时间、作业延误和设置成本。同时，它必须遵守各种约束，例如烤箱资格和可用性、作业发布时间、批次之间的设置时间和烤箱容量限制。获得有效调度的关键是将兼容的作业同时分批处理。在本文中，我们为 OSP 开发了理论上的、特定于问题的下界，这些下界可以非常快地计算出来。我们对这些下界进行了彻底的检查，评估了它们的质量并探索了它们与现有解决方案方法的集成。具体来说，我们研究了它们对精确方法和使用模拟退火的元启发式局部搜索方法的贡献。此外，这些特定于问题的下界使我们能够评估大型实例的解决方案质量，对于这些实例，精确方法通常无法提供紧密的边界。

发布时间: 10/3/2024

查看原文

生命，呃，自有出路：系统化神经搜索

作者: Alex Baranski, Jun Tani

我们致力于解决在全新环境中快速调整智能体行为以解决时空连续问题的挑战。动物展现出非凡的适应新环境的能力，这种能力是人工系统无法比拟的。我们没有专注于通过深度强化学习实现泛化，而是提出将行为视为搜索过程的物理表现形式，其中稳健的解决问题的能力源于对所有可能行为的穷举搜索。令人惊讶的是，这可以通过在线修改引导动作的认知图来有效地完成，挑战了在连续空间中穷举搜索不切实际的普遍观点。我们描述了一种算法，该算法通过调节行为执行和图突变之间的紧密反馈循环来隐式枚举行为，并提供了一种基于赫布学习和受内嗅皮层启发的全新高维谐波表示的神经实现。通过将行为定义为搜索，我们提供了一个数学上简单且生物学上合理的实时行为适应模型，成功地解决了各种连续状态空间导航问题。该框架不仅为其他应用提供了灵活的神经基质，而且还为理解适应性行为提供了一个强大的范式。我们的结果表明，在发展性学习和无监督技能获取方面可能取得进展，为自主机器人掌握复杂技能铺平道路，这些技能需要在数据稀疏的环境中灵活运用。

发布时间: 10/3/2024

查看原文

FanCric：多智能体框架，用于构建梦幻11板球队伍

作者: Mohit Bhatnagar

板球凭借其错综复杂的策略和悠久的历史，越来越吸引着全球观众。印度超级联赛 (IPL) 是二十20板球的典范，展示了在短短几小时内完成的比赛形式中的才能，与更长的比赛形式形成鲜明对比。IPL 以其技术与球迷互动相融合而闻名，是世界上最受欢迎的板球联赛。本研究重点关注 Dream11，这是印度领先的 IPL 幻想板球联赛，参与者根据真实球员的表现打造虚拟球队，在国际上进行比赛。打造一支获胜的幻想球队需要处理各种复杂因素，包括球员状态和比赛条件。传统上，这通过运筹学和机器学习来实现。本研究介绍了 FanCric 框架，这是一个先进的多代理系统，利用大型语言模型 (LLM) 和强大的编排框架来增强板球幻想球队的选择。FanCric 利用结构化和非结构化数据，通过整合先进的人工智能技术来超越传统方法。分析涉及仔细检查来自 Dream11 比赛的约 1270 万个独特条目，评估 FanCric 的效力与大众智慧和更简单的提示工程方法的对比。消融研究进一步评估了生成不同数量球队的影響。探索性发现很有希望，表明有必要进一步调查 FanCric 的能力，以充分发挥其在增强战略决策方面使用 LLM 在幻想体育和一般商业中的潜力。

发布时间: 10/3/2024

查看原文

关于启发式估计量的迭代期望定律

作者: Paul Christiano, Jacob Hilton, Andrea Lincoln, Eric Neyman, Mark Xu

Christiano 等人（2022）将 *启发式估计器* 定义为一种假设的算法，用于从参数估计数学表达式的值。简而言之，一个启发式估计器 $\mathbb{G}$ 以数学表达式 $Y$ 和形式化的“启发式参数” $\pi$ 作为输入，并输出 $Y$ 的估计值 $\mathbb{G}(Y \mid \pi)$。在这项工作中，我们主张一个非正式原则，即启发式估计器不应该能够预测它自身的错误，并探索将该原则形式化的途径。最简单地说，该原则表明，对于所有 $Y$ 和 $\pi$，$\mathbb{G}(Y - \mathbb{G}(Y \mid \pi) \mid \pi)$ 应该等于零。我们认为，一个理想的启发式估计器应该满足这方面的两个更强的性质，我们称之为 *迭代估计*（类似于迭代期望定律）和 *误差正交性*。虽然迭代估计和误差正交性在直觉上很有吸引力，但确定给定的启发式估计器是否满足这些性质可能很困难。作为一种替代方法，我们探讨了 *准确性*：一个（大致）表明 $\mathbb{G}$ 在数学表达式的分布上具有零平均误差的性质。然而，在两个估计问题的情况下，我们证明了创建准确的启发式估计器的障碍。最后，我们讨论了寻找符合我们对启发式估计器行为的直观理解的启发式估计器的挑战和潜在途径，以及启发式估计器在理解神经网络行为方面的潜在应用。

发布时间: 10/3/2024

查看原文

不确定性感知的人类移动建模与异常检测

作者: Haomin Wen, Shurui Cao, Leman Akoglu

给定大量人类代理随时间推移的 GPS 坐标，如何在没有标注数据的情况下，对他们的移动行为进行建模，以实现有效的异常检测（例如，用于恶意行为检测）？人类移动和轨迹建模已被广泛研究，在处理复杂输入和性能效率权衡方面能力各异。随着机器学习中更具表达力的模型的出现，我们尝试将 GPS 数据建模为一系列停留点事件，每个事件都具有一组特征化的时空特征，并利用现代序列模型（如 Transformer）进行无监督/自监督训练和推理。值得注意的是，受某些个体行为固有随机性的驱动，我们为模型配备了认知/数据不确定性估计。此外，为了处理各种行为的数据稀疏性，我们将认知/模型不确定性纳入我们的模型。认知和认知不确定性共同实现了鲁棒的损失和训练动态，以及异常评分中感知不确定性的决策。对数万个代理的大型专家模拟数据集的实验表明，我们的模型在预测和异常检测基线方面都非常有效。

发布时间: 10/3/2024

查看原文

基于生成扩散的契约设计，用于车联网中高效的 AI 双胞胎迁移

作者: Yue Zhong, Jiawen Kang, Jinbo Wen, Dongdong Ye, Jiangtian Nie, Dusit Niyato, Xiaozheng Gao, Shengli Xie

具身人工智能是一个快速发展的领域，它弥合了网络空间和物理空间之间的差距，使各种应用成为可能。这种演变导致了车辆具身人工智能网络 (VEANET) 的发展，其中先进的人工智能能力被集成到车辆系统中，以增强自主运行和决策。具身智能体，例如自动驾驶汽车 (AV)，是能够感知其环境并采取行动以实现特定目标的自主实体，积极地与物理世界互动。具身孪生是这些具身智能体的数字模型，各种具身人工智能孪生用于网络空间中的智能应用。在 VEANET 中，具身人工智能孪生充当车载人工智能助手，以执行各种任务，使用生成式人工智能模型支持自动驾驶。由于自动驾驶汽车的计算资源有限，这些自动驾驶汽车通常将计算密集型任务（例如构建和更新具身人工智能孪生）卸载到附近的 RSU。然而，由于自动驾驶汽车的快速移动性和单个 RSU 的有限提供范围，具身人工智能孪生需要实时地从当前 RSU 动态迁移到其他 RSU，导致选择合适的 RSU 以进行高效的具身人工智能孪生迁移的挑战。鉴于信息不对称，自动驾驶汽车无法了解 RSU 的详细信息。为此，在本文中，我们构建了自动驾驶汽车和替代 RSU 之间的多维契约理论模型。考虑到自动驾驶汽车可能表现出非理性行为，我们利用前景理论而不是预期效用理论来模拟自动驾驶汽车的实际效用。最后，我们采用基于生成扩散模型的算法来识别最佳契约设计。与传统的深度强化学习算法相比，数值结果证明了所提方案的有效性。

发布时间: 10/3/2024

查看原文

通过构建自己的指令来学习构建

作者: Aaron Walsman, Muru Zhang, Adam Fishman, Ali Farhadi, Dieter Fox

复杂视觉物体的结构理解是人工智能领域一个尚未解决的重要问题。为了研究这个问题，我们针对最近提出的 LTRON 中的 Break-and-Make 问题开发了一种新的技术，该问题要求智能体必须学会使用单个交互式会话来构建以前从未见过的乐高积木，以收集有关其组件及其结构的信息。我们通过构建一个名为 \textbf{\ours} 的智能体来解决这个问题，该智能体能够创建自己的视觉说明书。通过拆卸一个看不见的组件并定期保存它的图像，智能体能够创建一组说明，以便它拥有重建它所需的信息。这些说明构成了一个显式记忆，允许模型一步一步地推理组装过程，避免对长期隐式记忆的需求。这反过来又使我们能够训练比过去更大的乐高积木。为了展示这个模型的强大功能，我们发布了一个新的数据集，其中包含程序化构建的乐高车辆，平均每辆包含 31 块积木，需要超过一百步才能拆卸和重新组装。我们使用在线模仿学习训练这些模型，允许模型从自己的错误中学习。最后，我们还对 LTRON 和 Break-and-Make 问题进行了一些小的改进，以简化学习环境并提高可用性。

发布时间: 10/3/2024

查看原文

混合与匹配：多任务微调对大型语言模型性能的影响——金融领域案例研究

作者: Meni Brief, Oded Ovadia, Gil Shenderovitz, Noga Ben Yoash, Rachel Lemberg, Eitam Sheetrit

大型语言模型 (LLM) 在包括金融在内的特定领域中的应用迅速扩展。领域特定的 LLM 通常根据其在与该领域相关的各种下游任务中的表现进行评估。在本研究中，我们对微调 LLM 以执行此类任务进行了详细分析。有些令人意外的是，我们发现，在特定领域的情况下，仅针对目标任务进行微调并不总是最有效的策略。相反，多任务微调（模型在相关任务的混合中进行训练）可以显着提高性能。我们展示了这种方法如何使小型模型（如 Phi-3-Mini）能够实现最先进的结果，甚至在金融基准上超越了更大的 GPT-4-o 模型。我们的研究涉及大规模实验，使用多个广泛采用的 LLM 作为基线训练了 200 多个模型，并通过实证证实了多任务微调的优势。此外，我们探讨了使用通用指令数据作为正则化形式，表明它有助于最大限度地减少性能下降。我们还研究了数学数据的纳入，发现数值推理方面的改进有效地转移到了金融任务中。最后，我们注意到，虽然针对下游任务进行微调会导致任务性能的针对性改进，但它并不一定会带来领域知识或复杂领域推理能力的更广泛提升。

发布时间: 10/3/2024

查看原文

生成式人工智能在建筑行业的应用

作者: Hanlong Wan, Jian Zhang, Yan Chen, Weili Xu, Fan Feng

本论文探讨了生成式人工智能技术，特别是大型语言模型 (LLMs)，在建筑行业的变革潜力。通过利用这些先进的人工智能工具，该研究探索了它们在能源规范合规性、建筑设计优化和劳动力培训等关键领域的应用。研究强调了 LLM 如何自动化劳动密集型流程，显著提高建筑实践的效率、准确性和安全性。该论文还探讨了在建筑图纸和法规代码中解释复杂视觉和文本数据的挑战，并提出了增强人工智能驱动的合规性检查和设计流程的创新解决方案。此外，该研究还考虑了人工智能整合的更广泛影响，包括开发用于跨各种监管领域进行全面代码合规性的人工智能驱动的工具，以及人工智能通过现实模拟彻底改变劳动力培训的潜力。本文对生成式人工智能在建筑行业的当前能力进行了全面分析，同时概述了未来研究和开发方向，旨在为更智能、更可持续和更具响应性的建筑实践铺平道路。

发布时间: 10/3/2024

查看原文