arXiv 论文列表

作者: Gabriele De Vito, Filomena Ferrucci, Athanasios Angelakis

药物错误严重威胁着患者安全，导致不良药物事件并给医疗系统带来巨大的经济负担。旨在减轻这些错误的临床决策支持系统 (CDSS) 通常面临局限性，包括依赖静态数据库和基于规则的算法，这会导致高误报率和临床医生的警报疲劳。本文介绍了 HELIOT，这是一种用于药物过敏管理的创新型 CDSS，将大型语言模型 (LLM) 与全面的药物数据存储库相集成。HELIOT 利用先进的自然语言处理能力来解释复杂的医学文本并合成非结构化数据，克服了传统 CDSS 的局限性。使用合成患者数据集和专家验证的真实情况进行的实证评估表明，HELIOT 具有很高的准确性、精确度、召回率和 F1 分数，在多个实验运行中均达到 100%。结果强调了 HELIOT 在临床环境中增强决策支持的潜力，为管理药物过敏提供了一种可扩展、高效且可靠的解决方案。

发布时间: 9/26/2024

查看原文

Rao-Blackwellized POMDP 规划

作者: Jiho Lee, Nisar R. Ahmed, Kyle H. Wray, Zachary N. Sunberg

部分可观察马尔可夫决策过程 (POMDP) 为不确定条件下的决策制定提供了一个结构化框架，但其应用需要高效的信念更新。顺序重要性重采样粒子滤波器 (SIRPF)，也称为 Bootstrap 粒子滤波器，通常用作大型近似 POMDP 求解器中的信念更新器，但它们面临着粒子匮乏和随着系统状态维数增加而导致的计算成本高等挑战。为了解决这些问题，本研究引入了 Rao-Blackwellized POMDP (RB-POMDP) 近似求解器，并概述了在信念更新和在线规划中应用 Rao-Blackwellization 的通用方法。我们比较了 SIRPF 和 Rao-Blackwellized 粒子滤波器 (RBPF) 在一个模拟定位问题中的性能，其中代理使用 POMCPOW 和 RB-POMCPOW 规划器在 GPS 拒绝环境中导航到目标。我们的结果不仅证实了 RBPF 能够使用更少的粒子在一段时间内保持准确的信念近似，而且更令人惊讶的是，与相同计算限制下的 SIRPF 基于规划相比，RBPF 结合基于正交的积分显著提高了规划质量。

发布时间: 9/26/2024

查看原文

超越文本到文本：基于主题模型的多模态和生成式人工智能在教育领域的综述

作者: Ville Heilala, Roberto Araya, Raija H\"am\"al\"ainen

生成式人工智能（GenAI）可以重塑教育和学习。虽然像 ChatGPT 这样的大型语言模型（LLM）在当前的教育研究中占据主导地位，但诸如文本转语音和文本转图像等多模态能力却鲜有探索。本研究利用主题建模来绘制教育领域多模态和生成式人工智能的研究现状。利用 Dimensions.ai 进行的广泛文献搜索产生了 4175 篇文章。采用主题建模方法，提取了潜在主题，最终形成 38 个可解释的主题，并将其组织成 14 个主题领域。研究结果表明，在教育背景下，文本到文本模型占主导地位，而其他模态则未得到充分探索，忽视了多模态方法的更广泛潜力。结果表明存在研究空白，强调了在不同人工智能模态和教育水平之间更加平衡关注的重要性。总之，本研究概述了生成式人工智能在教育领域的当前趋势，强调了未来探索多模态技术以充分实现人工智能在教育中的变革潜力的机会。

发布时间: 9/26/2024

查看原文

天气预报器：利用时空Transformer赋能全球数值天气预报

作者: Junchao Gong, Tao Han, Kang Chen, Lei Bai

数值天气预报 (NWP) 系统是现代社会的重要基础设施。然而，传统的 NWP 系统通过使用大型计算集群求解复杂的偏微分方程来解决问题，导致了大量的碳排放。探索高效且环保的 NWP 解决方案引起了人工智能 (AI) 和地球科学界的兴趣。为了缩小基于 AI 的方法与物理预测器之间的性能差距，本文提出了一种新的基于 Transformer 的 NWP 框架，称为 WeatherFormer，用于模拟复杂的时空大气动力学，并增强数据驱动 NWP 的能力。WeatherFormer 创新地引入了时空分解 Transformer 模块，以减少参数和内存消耗，其中提出了位置感知自适应傅里叶神经算子 (PAFNO) 用于位置敏感的令牌混合。此外，还采用了两种数据增强策略来提高性能并减少训练消耗。在 WeatherBench 数据集上的大量实验表明，WeatherFormer 在现有深度学习方法中取得了优异的性能，并进一步接近最先进的物理模型。

发布时间: 9/26/2024

查看原文

A 代表吸收：研究稀疏自动编码器中的特征分裂和吸收

作者: David Chanin, James Wilken-Smith, Tom\'a\v{s} Dulka, Hardik Bhatnagar, Joseph Bloom

稀疏自动编码器（SAEs）已成为将大型语言模型（LLMs）的激活分解为人类可解释的潜在特征的一种很有前景的方法。本文提出了两个问题。首先，SAEs 在多大程度上提取了单义且可解释的潜在特征？其次，改变 SAE 的稀疏性或大小在多大程度上影响了单义性/可解释性？通过在一个简单的首字母识别任务中研究这些问题，在这个任务中我们能够完全访问词汇表中所有标记的真实标签，我们能够提供比之前调查更详细的信息。至关重要的是，我们识别出一种称为特征吸收的特征分裂问题，在这种问题中，看似单义的潜在特征在它们明显应该触发的情况下却未能触发。我们的调查表明，改变 SAE 的大小或稀疏性不足以解决这个问题，并且存在需要解决的更深层的概念问题。

发布时间: 9/25/2024

查看原文

抗体开发中的对手塑造

作者: Sebastian Towers, Aleksandra Kalisz, Philippe A. Robert, Alicia Higueruelo, Francesca Vianello, Ming-Han Chloe Tsai, Harrison Steel, Jakob N. Foerster

抗病毒疗法通常针对当前的病毒株设计。从博弈论的角度来看，这对应着一种短视或近视的反应。然而，治疗诱导的选择压力作用于病毒抗原，驱动突变株的出现，而初始疗法对这些突变株的疗效降低。基于抗体与病毒抗原结合的计算模型（Absolut! 框架），我们设计并实施了这种病毒进化逃逸的遗传模拟。至关重要的是，这允许我们的抗体优化算法考虑和影响病毒的整个逃逸曲线，即引导（或“塑造”）病毒进化。这受到对手塑造的启发，对手塑造在一般和学习中，考虑了共同玩家的适应，而不是玩一个近视的最佳响应。因此，我们将优化后的抗体称为塑造者。在我们的模拟中，我们证明了我们的塑造者针对当前和模拟的未来病毒变异体，优于以近视方式选择的抗体。此外，我们表明，与近视抗体相比，塑造者对病毒施加了特定的进化压力。总而言之，塑造者改变了病毒株的进化轨迹，并最大限度地减少了与近视对应物相比的病毒逃逸。虽然这是一个简化的模型，但我们希望我们提出的范式能够在未来发现更持久的疫苗和抗体疗法，这得益于模拟工具能力的快速进步。我们的代码可在 https://github.com/olakalisz/antibody-shapers 上获得。

发布时间: 9/25/2024

查看原文

精准水产养殖：基于计算机视觉和物联网的罗非鱼优化喂食方法

作者: Rania Hossam, Ahmed Heakl, Walid Gomaa

传统的鱼类养殖方式往往导致喂食效率低下，从而引发环境问题并降低生产力。我们开发了一个结合计算机视觉和物联网技术的创新系统，用于精确的罗非鱼喂食。我们的解决方案使用实时物联网传感器监测水质参数，并使用计算机视觉算法分析鱼的大小和数量，从而确定最佳的饲料量。一个移动应用程序可以实现远程监控和控制。我们利用 YOLOv8 进行关键点检测，从长度测量罗非鱼的重量，在 3,500 张标注图像上实现了 **94%** 的精度。基于像素的测量值使用深度估计转换为厘米，以进行准确的喂食计算。我们的方法，通过数据收集模拟推理条件，显著提高了结果。初步估计表明，与传统养殖场相比，这种方法可以将产量提高 58 倍。我们的模型、代码和数据集是开源的~\footnote{代码、数据集和模型可应合理要求提供。

发布时间: 9/25/2024

查看原文

带预算的随机多轮次子模优化

作者: Vincenzo Auletta, Diodato Ferraioli, Cosimo Vinci

在这项工作中，我们研究了随机预算多轮次子模最大化 (SBMSm) 问题，旨在自适应地最大化多个轮次中定义在项目子集上的单调且子模目标函数的总和。目标函数还取决于随机事件的实现，并且我们可以在所有轮次中选择的项目总数受限预算限制。这个问题扩展了并推广到多轮次设置，例如 (自适应) 影响最大化和随机探测等经过充分研究的问题。我们证明，如果项目和随机事件的数量在某种程度上是有限的，则存在 SBMSm 的多项式时间动态规划算法。然后，我们为 SBMSm 提供了一个简单的贪心 $1/2(1-1/e-\epsilon)\approx 0.316$ 近似算法，该算法首先非自适应地分配每个轮次要花费的预算，然后使用分配给每个轮次的预算贪婪且自适应地最大化目标函数。最后，我们引入了“预算自适应差距”，通过它来衡量 SBMSm 的自适应策略比最佳部分自适应策略好多少，后者与我们的贪心算法一样，预先确定预算分配。我们证明预算自适应差距介于 $e/(e-1)\approx 1.582$ 和 $2$ 之间。

发布时间: 9/25/2024

查看原文

历史轨迹辅助零阶联邦优化

作者: Xiaoyu He, Chenlin Wu, Zike Li, Zibin Zheng

联邦学习是一种分布式学习框架，它允许客户端独立训练模型，并将模型更新上传进行聚合。本地训练过程高度依赖于分布式梯度下降技术。在梯度信息不可用的情况下，需要从零阶信息中估计梯度，这通常涉及沿着各向同性随机方向计算有限差分。这种方法存在着高估计误差，因为在各向同性采样过程中可能会忽略目标景观的几何特征。在这项工作中，我们提出了一种非各向同性采样方法来改进梯度估计过程。在我们的方法中，梯度是在由解的历史轨迹所跨越的子空间中估计的，旨在鼓励探索有希望的区域，从而提高收敛速度。我们在零阶联邦设置中实现了这种方法，并表明收敛速度与现有方法一致，同时在通信或本地计算方面没有引入显著的开销。我们的提议的有效性在与几种常用的零阶联邦优化算法的比较中，通过几个数值实验得到了验证。

发布时间: 9/25/2024

查看原文

TFT-multi：重症监护室生命体征轨迹的同步预测

作者: Rosemary Y. He, Jeffrey N. Chiang

医疗数据中的轨迹预测是精准医疗和计算方法在临床整合中的一个重要研究领域。近年来，生成式 AI 模型在捕获时间序列数据的短期和长期依赖关系方面展现出令人鼓舞的结果。尽管这些模型也已应用于医疗保健领域，但大多数模型一次只预测一个值，这在临床环境中是不切实际的，因为在临床环境中会同时测量多个指标。在这项工作中，我们扩展了时间融合变换器 (TFT) 框架，这是一种多时间范围时间序列预测工具，并提出了 TFT-multi，一个端到端的框架，可以同时预测多个重要指标的轨迹。我们将 TFT-multi 应用于预测重症监护病房中记录的 5 个生命体征：血压、脉搏、SpO2、体温以及呼吸频率。我们假设，通过联合预测这些通常相互关联的指标，我们可以做出更准确的预测，尤其是在缺失率较高的变量中。我们在公开的 MIMIC 数据集和一个独立的机构数据集上验证了我们的模型，并证明该方法优于最先进的单变量预测工具，包括原始 TFT 和 Prophet，以及用于多变量预测的向量回归建模。此外，我们通过将我们的管道应用于预测对实际和假设的升压剂给药的响应的血压变化，进行了一个案例分析研究。

发布时间: 9/25/2024

查看原文