arXiv 论文列表

作者: Raj Sanjay Shah, Lei Xu, Qianchu Liu, Jon Burnsky, Drew Bertagnolli, Chaitanya Shivade

arXiv:2503.20648v1 交叉类型：公告摘要：行为疗法笔记对于法律合规和患者护理都非常重要。与身体健康状况下的进步记录不同，针对行为疗法笔记的质量标准尚未充分发展。为了解决这一差距，我们与持照治疗师合作设计了一个全面的评估框架，用于评估疗法笔记的关键维度：完整性、简洁性和忠实性。此外，我们扩展了一个公开的行为健康对话数据集，其中包含治疗师撰写的内容和由大模型生成的内容，并应用我们的评估框架来衡量它们的质量。我们发现：(1) 基于评分标准的手动评估协议比传统的李克特量表注释提供了更可靠和可解释的结果。(2) 大模型在评估完整性与简洁性方面可以模仿人类评估者的表现，但在忠实性方面则存在问题。(3) 治疗师撰写的内容往往缺乏完整性和简洁性，而由大模型生成的内容则包含幻觉。令人惊讶的是，在盲测中，治疗师更倾向于选择大模型生成的内容，并认为其优于治疗师撰写的内容。

发布时间: 3/27/2025

查看原文

$\beta$-GNN：一种对抗图结构扰动的稳健集成方法

作者: Haci Ismail Aslan, Philipp Wiesner, Ping Xiong, Odej Kao

arXiv:2503.20630v1 类别: cross 摘要: 图神经网络(GNNs)在计算系统的高效运作和安全中正发挥着越来越重要的作用，其应用包括负载调度、异常检测和资源管理。然而，它们对网络干扰的脆弱性带来了重大挑战。我们提出了 $\beta$-GNN，这是一种在不牺牲干净数据性能的情况下增强GNN鲁棒性的模型。$\beta$-GNN 使用加权集成，结合任意的GNN与多层感知机。一个学习到的动态权重 $\beta$ 调节GNN的贡献。这个 $\beta$ 不仅权衡了GNN的影响，还指示了数据干扰的水平，从而实现主动防范。在多种数据集上的实验结果表明，$\beta$-GNN 在对抗性准确性方面表现出色，并且能够量化攻击严重性。最关键的是，$\beta$-GNN 避免了干扰假设，从而保存了干净数据的结构和性能。

发布时间: 3/27/2025

查看原文

协作故事叙述与大规模语言模型：自动生成角色扮演游戏会话的语文学分析

作者: Alessandro Maisto

arXiv:2503.20623v1 Announce Type: cross 摘要：角色扮演游戏（RPG）是玩家相互互动以创建叙述的游戏。玩家在RPG中的角色主要基于玩家与其角色之间的互动。这种新兴的共享叙述形式，主要是口头叙述的形式，正受到越来越多的关注。特别是，许多作者研究了将大语言模型（LLM）作为游戏中的参与者使用的方法。在本文中，我们旨在探索当要求LLM生成RPG会话且没有人类干预时，LLM的语言在多大程度上展现出口头或书面特征。我们将对生成文本的词汇和语法特征进行语义分析，并将其结果与人类RPG会话的对话记录和书籍的分析进行比较。我们发现，LLMs表现出与其他所有文本类别（包括口头对话、人类RPG会话和书籍）都不同的模式。我们的分析展示了训练对LLMs表达方式的影响，并提供了这些工具叙述能力的重要线索。

发布时间: 3/27/2025

查看原文

状态意识扰动优化以实现稳健的深度强化学习

作者: Zongyuan Zhang, Tianyang Duan, Zheng Lin, Dong Huang, Zihan Fang, Zekai Sun, Ling Xiong, Hongbin Liang, Heming Cui, Yong Cui

arXiv:2503.20613v1 Announce Type: cross 摘要：近年来，深度强化学习（DRL）已成为机器人控制的一种有前景的方法。然而，DRL在实际机器人中的部署受到了其对环境扰动的敏感性的影响。尽管现有的白盒对抗攻击依赖于局部梯度信息，并在所有状态下施加均匀的扰动来评估DRL的鲁棒性，但它们未能考虑时间动态性和状态特定的脆弱性。为了应对上述挑战，我们首先通过建立白盒攻击下的对抗受害动力学马尔可夫决策过程（AVD-MDP）对DRL中的白盒攻击进行了理论分析，以推导出成功攻击的必要和充分条件。在此基础上，我们提出了一种名为STAR的选择性状态感知强化对抗攻击方法，以优化扰动的隐蔽性和状态访问分散性。STAR首先采用基于软掩码的状态目标机制，以最小化冗余扰动，增强隐蔽性和攻击效果。然后，它引入一种信息理论优化目标，以最大化扰动、环境状态和受害方行动之间的互信息，确保分散的状态访问分布，引导受害方代理进入最易受损的状态以实现最大回报减少。广泛的实验表明，STAR优于现有的基准方法。

发布时间: 3/27/2025

查看原文

基于决策理论的方法处理量子力学中的不确定性

作者: Keano De Vos, Gert de Cooman, Alexander Erreygers, Jasper De Bock

arXiv:2503.20607v1 交叉类型公告摘要：我们提供了一种决策理论框架，用于处理量子力学中的不确定性。这种不确定性具有两方面：一方面，可能对量子系统的状态存在不确定性；另一方面，即使知道了量子态，测量结果也可能会产生不确定性，这一点对于量子力学的不确定性至关重要。在我们的框架中，测量因此扮演了具有不确定结果的行为的角色，而我们简单的决策理论假设确保了生的规则被包含在与这些行为相关的效用函数中。这种方法允许我们解耦精确的概率论与量子力学，也就是说，它为更一般的，所谓的不确定概率方法留下了空间。我们讨论了我们发现的数学含义，这使我们能够为贝纳洛利、法卡尼和扎佛朗最近的重要工作提供一种决策理论基础，并将我们的方法与德因和沃尔科早期且不同的方法进行比较。

发布时间: 3/27/2025

查看原文

StableToolBench-MirrorAPI: 将工具环境建模为7,000+真实世界API的镜像

作者: Zhicheng Guo, Sijie Cheng, Yuchen Niu, Hao Wang, Sicheng Zhou, Wenbing Huang, Yang Liu

arXiv:2503.20527v1 类型: cross 摘要：大规模语言模型（LLMs）的迅速发展激发了对工具学习的兴趣，即通过在LLMs中添加外部工具来处理复杂任务。然而，现有的工具环境在平衡稳定性和可扩展性以及真实性方面面临着挑战，特别是在基准测试方面。为了解决这一问题，我们提出了一种名为MirrorAPI的新型框架，该框架训练专门的LLMs以准确模拟真实API的响应，有效地充当“镜子”，反映工具环境的真实情况。通过使用来自7,000多个API的请求-响应数据集，并采用监督微调和链式推理方法来提高模拟精度。MirrorAPI在MirrorAPI-Bench上的表现和与StableToolBench的集成均证明其在准确性和稳定性方面优于现有的最先进的方法。

发布时间: 3/27/2025

查看原文

GAIA-2：一个可控的多视图生成世界模型用于自主驾驶

作者: Lloyd Russell, Anthony Hu, Lorenzo Bertoni, George Fedoseev, Jamie Shotton, Elahe Arani, Gianluca Corrado

arXiv:2503.20523v1 宣言类型: cross 摘要：生成模型为模拟复杂环境提供了可扩展且灵活的范式，但当前的方法在解决自主驾驶领域的特定需求方面存在不足，例如多-Agent交互、精细控制以及多摄像头一致性。我们介绍了GAIA-2，这是一种生成AI自动化，它在一个统一的生成框架中整合了这些能力。GAIA-2 支持基于丰富结构化输入的可控视频生成：ego-车辆动态、Agent配置、环境因素以及道路语义。该模型生成高分辨率、时空一致的多摄像头视频，跨越地理上不同的驾驶环境（英国、美国、德国）。该模型结合了结构化条件和外部潜在嵌入（例如，来自专有的驾驶模型）的功能，以实现灵活且语义合理的场景合成。通过这种整合，GAIA-2 允许大规模模拟常见和罕见的驾驶场景，推动生成世界模型作为自主系统开发核心工具的应用。视频可在 https://wayve.ai/thinking/gaia-2 获取。

发布时间: 3/27/2025

查看原文

基于神经网络的接收机架构的设计与评估

作者: H\"useyin \c{C}evik, Erhan Karakoca, \.Ibrahim H\"okelek, Ali G\"or\c{c}in

arXiv:2503.20500v1 交叉类型: 摘要: 基于神经网络的接收器利用深度学习优化信号检测和解码，显著提高了在复杂环境中的位误差率（BER）和块误差率（BLER）。本研究评估了各种架构，并在不同的噪声水平下比较了它们的BER和BLER性能。两种新型模型，双注意变换器（DAT）和残差双非局部注意网络（RDNLA），结合了自注意力和残差学习以提升信号重建。这些模型通过直接从接收到的信号和噪声方差预测对数似然比（LLRs）来绕过传统的信道估计和均衡。模拟结果显示，在不同的信噪比（SNR）条件下，DAT和RDNLA优于传统和其他神经接收器模型，同时其计算效率支持其在下一代通信系统中的可行性。

发布时间: 3/27/2025

查看原文

Towards高效且通用的少量样本误分类检测方法用于视觉-语言模型

作者: Fanhu Zeng, Zhen Cheng, Fei Zhu, Xu-Yao Zhang

arXiv:2503.20492v1 交叉公告类型：cross 摘要：对于将分类器部署在高安全性和动态变化的情况下，可靠的预测至关重要。然而，现代神经网络经常表现出对误分类预测的过度自信，这突显了进行信心估计以检测错误的需要。尽管现有的方法已经在小型数据集上取得了成就，但它们都需要从头训练，并且没有高效且有效的误分类检测（MisD）方法，这阻碍了向大规模和不断变化的数据集的实用应用。在本文中，我们利用视觉语言模型（VLM）利用文本信息来建立一个高效且通用的误分类检测框架。通过发挥VLM的力量，我们构建了FSMisD，这是一种基于少量提示学习框架的MisD框架，以避免从头训练，从而提高调整效率。为了增强误分类检测能力，我们使用自适应伪样本生成和一种新颖的负损失来通过将类别提示远离伪特征来缓解过度自信的问题。我们进行了全面的实验，并通过领域转移验证了该框架在各种数据集上的泛化能力。显著且一致的改进证明了我们方法的有效性、效率和泛化能力。

发布时间: 3/27/2025

查看原文

基于卷积尖峰神经网络的水下图像增强

作者: Vidya Sudevan, Fakhreddine Zayer, Rizwana Kausar, Sajid Javed, Hamad Karki, Giulia De Masi, Jorge Dias

arXiv:2503.20485v1 Announce Type: cross 摘要：水下图像增强（UIE）对于海洋应用，包括自主基于视觉的导航至关重要。使用卷积神经网络（CNN）和视觉变换器的深度学习方法提高了UIE的性能。最近，脉冲神经网络（SNN）由于其轻量级设计、能源效率和可扩展性而引起了关注。本文介绍了UIE-SNN，这是第一个基于SNN的UIE算法，用于提高水下图像的可见度。UIE-SNN是一个带有跳连接的19层卷积脉冲编码-解码框架，直接使用潜梯度替代的反向时间传播（BPTT）策略进行训练。我们探讨并验证了训练数据集对能量降低的影响，这是UIE-SNN架构的一个独特优势，与传统的基于学习的架构相比，能量消耗取决于模型。UIE-SNN在潜在空间表示中优化损失函数以重建清晰的水下图像。我们的算法在减少的时间步长（$T=5$）和能量消耗（$85\%$）下，在PSNR和结构相似性指数（SSIM）方面与非脉冲版本的算法表现相当。该算法在UIEB和EUVP两个公开的基准数据集上进行训练，并在UIEB、EUVP、LSUI、U45和我们自定义的UIE数据集上对未见过的图像进行测试。UIE-SNN算法在UIEB上实现了PSNR为$17.7801~dB$和SSIM为$0.7454$，在EUVP上实现了PSNR为$23.1725~dB$和SSIM为$0.7890$。与非脉冲版本的算法相比，UIE-SNN以更少的操作数（$147.49$ GSOPs）和更少的能量（$0.1327~J$）实现了这一算法性能。与现有最先进的UIE方法相比，UIE-SNN在能量效率方面平均提高了$6.5\times$。源代码可在\href{https://github.com/vidya-rejul/UIE-SNN.git}{UIE-SNN}获取。

发布时间: 3/27/2025

查看原文