arXiv 论文列表

基于深度学习算法的粒子流能量分布重建

作者: Han Zhang (College of Artificial Intelligence and Automation, Hohai University), Shengxiang Lin (Faculty of Electronic and Information Engineering, Xi'an Jiaotong University), Xingyi Zhang (School of Mechanical Engineering, Shanghai Jiao Tong University), Yu Wang (School of Control and Computer Engineering, North China Electric Power University), Yangguang Zhang (School of Automation and Electrical Engineering, University of Science and Technology Beijing)

在高能粒子物理学中，从复杂的探测器信号中提取信息对于能量重建至关重要。最近的进展涉及使用深度学习来处理来自大型强子对撞机 (LHC) 等实验中各种子探测器的量热计图像，以进行能量图重建。本文比较了经典算法（MLP、CNN、U-Net 和 RNN）及其包含自注意力和 3D 卷积模块的变体，以评估它们在重建初始能量分布方面的有效性。此外，使用喷射事件测试数据集来分析和比较模型在处理异常高能事件方面的性能。分析突出了深度学习技术在能量图像重建方面的有效性，并探讨了它们在该领域的潜力。

发布时间: 10/11/2024

查看原文

金融关系图的评估：先解读再预测

作者: Yingjie Niu, Lanxin Lu, Rian Dolphin, Valerio Poti, Ruihai Dong

准确且稳健的股票趋势预测一直是一项至关重要且极具挑战的任务，因为股票价格的变化受多种因素影响。基于图神经网络的方法通过构建反映股票内部因素和关系的股票关系图，最近在该领域取得了显著成功。然而，由于缺乏合适的数据集，大多数方法依赖于预定义的因素来构建静态的股票关系图，无法捕捉到股票关系的动态变化。此外，这些方法中关系图的评估通常与神经网络模型在下游任务中的表现相关联，导致混淆和不精确。为了解决这些问题，我们介绍了基于标准普尔 500 指数股票收集的 SPNews 数据集，以促进动态关系图的构建。此外，我们提出了一套新颖的金融关系图评估方法，这些方法独立于下游任务。通过利用关系图来解释历史金融现象，我们在构建图神经网络之前评估其有效性，确保该图在捕捉相关金融关系方面的有效性。实验结果表明，我们的评估方法可以有效地区分各种金融关系图，与传统方法相比，产生更具解释性的结果。为了促进可重复性和该领域的进一步研究，我们在 GitHub 上公开发布了我们的源代码。

发布时间: 10/11/2024

查看原文

模型库-索拉竞赛解决方案技术报告

作者: Shengfu Chen, Hailong Liu, Wenzhao Wei

本报告介绍了 Modelscope-Sora 挑战中采用的方法，该挑战侧重于为视频生成模型微调数据。该挑战评估参与者在特定计算约束下分析、清理和生成用于基于视频的文本到视频任务的高质量数据集的能力。所提供的方法包括数据处理技术，例如视频描述生成、过滤和加速。本报告概述了用于提高训练数据质量的程序和工具，以确保文本到视频生成模型的性能得到改善。

发布时间: 10/11/2024

查看原文

代理 S：一个将计算机像人类一样使用的开放式代理框架

作者: Saaket Agashe, Jiuzhou Han, Shuyu Gan, Jiachen Yang, Ang Li, Xin Eric Wang

我们提出了 Agent S，一个开放的代理框架，它通过图形用户界面 (GUI) 实现了与计算机的自主交互，旨在通过自动化复杂的多步骤任务来改变人机交互。Agent S 旨在解决自动化计算机任务中的三个关键挑战：获取特定领域知识，规划长期的任务范围以及处理动态的、非统一的界面。为此，Agent S 引入了经验增强分层规划，它从外部知识搜索和内部经验检索中学习，并在多个层面上进行学习，从而促进高效的任务规划和子任务执行。此外，它采用了一种代理-计算机接口 (ACI)，以更好地基于多模态大型语言模型 (MLLM) elicits GUI 代理的推理和控制能力。在 OSWorld 基准测试上的评估表明，Agent S 在成功率方面比基线高出 9.37%（相对提高 83.6%），并取得了新的最先进水平。全面的分析突出了各个组件的有效性，并为未来的改进提供了见解。此外，Agent S 在新发布的 WindowsAgentArena 基准测试中展示了对不同操作系统的广泛泛化能力。代码可在 https://github.com/simular-ai/Agent-S 获得。

发布时间: 10/11/2024

查看原文

基于生成式人工智能技术的美国住宅太阳能采用和发电数字孪生合成方法

作者: Aparna Kishore, Swapna Thorve, Madhav Marathe

住宅屋顶太阳能的采用被认为是减少碳排放的关键。然而，缺乏更精细分辨率（例如，家庭、每小时级别）的光伏 (PV) 数据对明智决策构成重大障碍。本文讨论了一种新颖的方法，用于为美国本土生成高度细粒度的、住宅规模的、真实的屋顶太阳能采用数据集。这种数据驱动方法包括：(i) 集成的机器学习模型来识别光伏采用者，(ii) 使用可解释人工智能技术增强数据的方法，以洞察关键特征及其相互作用，以及 (iii) 使用分析模型生成家庭级别的每小时太阳能产量的方法。生成的合成数据集使用真实世界数据进行验证，可以作为数字孪生来模拟下游任务。最后，利用数字孪生的基于政策的案例研究表明，在弗吉尼亚州，30% 的联邦太阳能投资税收抵免促进了屋顶太阳能的采用，特别是在低收入和中等收入社区。

发布时间: 10/11/2024

查看原文

SAKA：一个用于半自动化知识图谱构建与应用的智能平台

作者: Hanrong Zhang, Xinyue Wang, Jiabao Pan, Hongwei Wang

知识图谱 (KG) 技术广泛应用于多个领域，许多公司提供基于 KG 的应用程序。然而，大多数 KG 平台需要用户具备专业知识，并投入大量时间和精力手动构建 KG 记录，这给普通用户带来了很大困难。此外，音频数据丰富，蕴含着宝贵的信息，但将其转化为 KG 却极具挑战。更重要的是，这些平台通常无法充分利用用户构建的 KG 的潜力。本文提出了一种智能且友好的半自动 KG 构建与应用平台 (SAKA)，以解决上述问题。首先，用户可以通过与平台交互，从多个领域的结构化数据中半自动地构建 KG，并在此基础上存储、查看、管理和更新 KG 的多个版本。此外，我们提出了一种基于音频的 KG 信息提取 (AGIE) 方法，用于从音频数据中建立 KG。最后，该平台基于用户创建的 KG，创建了一个基于语义解析的知识库问答 (KBQA) 系统。我们在 SAKA 平台上证明了半自动 KG 构建方法的可行性。

发布时间: 10/11/2024

查看原文

内在可解释性的电路发现的计算复杂性

作者: Federico Adolfi, Martina G. Vilas, Todd Wareham

许多机器学习、认知/脑科学和社会中提出的神经网络应用都依赖于通过电路发现实现内部可解释性的可行性。这需要对可行的算法选择进行实证和理论探索。尽管启发式算法的设计和测试取得了进展，但人们对它们的可扩展性和忠实性表示担忧，因为我们目前还不了解它们所部署的解决问题的复杂性特性。为了解决这个问题，我们利用经典和参数化计算复杂性理论研究电路发现：(1) 我们描述了一个概念框架，以根据描述、解释、预测和控制的可能性来推断电路查找查询；(2) 我们正式化了一套全面的查询，这些查询捕捉了机制解释，并提出了一种用于分析它们的正式框架；(3) 我们使用它来确定许多查询变体和对多层感知器（例如，transformer 的一部分）的实际兴趣的松弛的复杂性。我们的发现揭示了一个具有挑战性的复杂性景观。许多查询是难以处理的（NP-hard，$\Sigma^p_2$-hard），在限制模型/电路特征（例如，深度）时仍然是固定参数难以处理的（W[1]-hard），并且在加法、乘法和概率近似方案下是不可近似的。为了在这一景观中进行导航，我们证明存在一些转换可以解决其中一些难题（NP- vs. $\Sigma^p_2$-complete），并利用理解更好的启发式方法，并证明更适度的查询的可处理性（PTIME）或固定参数可处理性（FPT），这些查询保留了有用的可能性。该框架使我们能够理解可解释性查询的范围和局限性，探索可行的选项，并比较现有和未来架构中的资源需求。

发布时间: 10/11/2024

查看原文

基于自适应策略切换的强化学习中时序逻辑约束的概率满足

作者: Xiaoshan Lin, Sad{\i}k Bera Y\"uksel, Yasin Yaz{\i}c{\i}o\u{g}lu, Derya Aksaray

约束强化学习（CRL）是机器学习的一个分支，它在传统的强化学习（RL）框架中引入了约束。与仅旨在最大化累积奖励的传统 RL 不同，CRL 结合了额外的约束，这些约束代表了代理在学习过程中必须遵守的特定任务要求或限制。本文解决了一种 CRL 问题，其中代理旨在学习最佳策略以最大化奖励，同时确保在整个学习过程中达到期望的时序逻辑约束满足水平。我们提出了一种新颖的框架，该框架依赖于在纯粹学习（奖励最大化）和约束满足之间切换。该框架根据之前的试验估计约束满足的概率，并适当地调整在学习和约束满足策略之间切换的概率。我们从理论上验证了所提算法的正确性，并通过全面的模拟展示了其性能和可扩展性。

发布时间: 10/11/2024

查看原文

基于本体驱动的论证来确保大型语言模型的对抗鲁棒性

作者: Tomas Bueno Momcilovic, Beat Buesser, Giulio Zizzo, Mark Purcell, Tomas Bueno Momcilovic

尽管大型语言模型（LLMs）具有令人印象深刻的适应性，但在确保其安全性、透明度和可解释性方面仍然存在挑战。鉴于其容易受到对抗性攻击的影响，LLMs 需要通过对抗性训练和护栏的不断组合来防御。然而，管理用于持续确保鲁棒性的隐性和异构知识是困难的。我们提出了一种基于形式化论证的 LLM 对抗鲁棒性保证新方法。利用本体进行形式化，我们构建了最先进的攻击和防御，便于创建可被人理解的保证案例和可被机器理解的表示。我们通过英语语言和代码翻译任务中的示例演示了其应用，并通过针对工程师、数据科学家、用户和审计员，为理论和实践提供了启示。

发布时间: 10/11/2024

查看原文

函数-表示统一框架

作者: Alfredo Ibias, Hector Antona, Guillem Ramirez-Miranda, Enric Guinovart, Eduard Alarcon

认知架构是我们在人工智能认知研究中的前沿领域。然而，它们从分离的记忆和程序计算模型来解决问题。这种计算模型提出了一个基本问题：知识检索启发式。本文提出了一种新的计算模型来解决这个问题，该模型将记忆和程序统一起来：函数表示。我们提出一个关于如何实现和使用这些函数表示的完整框架，并通过数学定义和证明探索其潜力。我们还讨论了组织多个函数表示的不同方法，并探讨了这些函数表示可以实现的函数类型。最后，我们还探讨了我们提议的局限性。

发布时间: 10/11/2024

查看原文