LLM2D

arXiv 论文列表

作者: Jim W. Barrett, Nils Erlanson, Joana F\'elix China, G. Niklas Nor\'en
arXiv:2504.03729v1 宣布类型: 新 摘要:药品安全性监测实践依赖于大型个例安全报告数据库,以检测和评估药物或疫苗与不良事件之间潜在的新因果关联。重复报告是指涉及同一患者在特定时间发生的同一不良事件的独立且未链接的报告。它们妨碍了统计分析并误导了临床评估。由于此类数据库的庞大,无法进行手动识别重复报告,因此必须采用计算方法。本文在先前最先进的模型 vigiMatch 的基础上进行改进,修改了现有特征并引入了新的特征以针对原始模型已知的缺点。构建了两种支持向量机分类器,一种用于药物,一种用于疫苗,它们将报告对分类为重复或非重复报告。召回率通过使用5个多样化的独立标记测试集进行测量。精确率通过让每个模型对随机选择的报告对流进行分类,直到每个模型分类了100个对作为重复报告再进行测量。这些报告对由一名医学医生进行评估,未指示哪种方法(或方法组合)标记了每个报告对。通过对三个不同国家的重复报告对子集进行评估,测量了该模型对单个国家的性能。新模型在所有标记数据集上的精确率和召回率均高于之前最先进的模型,且药物和疫苗的性能相当。该模型在单个国家的报告对上显示出明显的较少误报,比比较模型表现更好。本方法在此领域中推进了药物和疫苗不良事件报告重复检测的先进水平。
发布时间: 4/8/2025
查看原文
作者: Lihui Liu, Zihao Wang, Dawei Zhou, Ruijie Wang, Yuchen Yan, Bo Xiong, Sihong He, Kai Shu, Hanghang Tong
arXiv:2504.03720v1 通知类型: 新 摘要:知识图谱(KGs)在各种应用中无处不在且广泛使用。然而,大多数现实中的知识图谱都是不完整的,这对下游任务的性能产生了显著影响。此外,现实中的知识图谱中的关系常常遵循长尾分布,这意味着大多数关系仅由少数训练三元组表示。为了解决这些问题,引入了少样本学习。少样本知识图谱补全旨在在只有有限数量的训练三元组可用的情况下,对涉及新关系的三元组进行准确预测。尽管提出了许多方法,但它们通常单独学习每个关系,忽视了不同任务之间的关联以及先前训练任务中的相关信息。在这篇论文中,我们提出了一种基于转移学习的少样本知识图谱补全方法(TransNet)。通过学习不同任务之间的关系,TransNet有效地将相似任务的知识转移到当前任务,以提高其性能。此外,通过使用元学习,TransNet可以有效地泛化到新的未见过的关系。在基准数据集上的广泛实验表明,TransNet在现有方法中具有优越性。代码可以在 https://github.com/lihuiliullh/TransNet/tree/main 上找到。
发布时间: 4/8/2025
查看原文
作者: Ying-Jung Chen, Chi-Sheng Chen, Ahmad Albarqawi
arXiv:2504.03699v1 说明类型: 新型 摘要: 在数据驱动医学的时代,将可解释且伦理管理的人工智能纳入临床决策支持系统的解释中,以实现可信赖且有效的患者护理至关重要。本文的重点在于一种新的多智能体系统架构,该架构使用模块化智能体来分析实验室结果、生命体征以及临床背景,然后将这些结果综合起来,以驱动预测并验证结果。我们使用eICU数据库实现了针对实验室分析的特定智能体、生命体征仅 interpreters 以及上下文推理器,并运行预测模块和验证智能体。一切都是一种透明的业务逻辑实现,受到伦理AI治理原则如自主性、公平性和问责制的影响。它提供了可见的结果,证明了基于代理的方法不仅提高了可解释性和准确性,还增强了在重症监护环境中AI辅助决策的可信度。
发布时间: 4/8/2025
查看原文
arXiv:2504.03649v1 宣布类型: 新闻 摘要: 法国公司EDF使用监督控制和数据采集系统与数据管理平台相结合来监测水电站,允许工程师和技术人员分析收集的时间序列数据。根据所监测水电站的战略重要性,收集的时间序列数据数量差异很大,这使得从提取的数据中生成有价值的信息变得困难。为了应对这一特定问题,本文开发了一种结合聚类算法和自编码神经网络进行模式识别的条件检测和诊断方法,并在本文中进行了展示。首先,使用一个降维算法创建一个2维或3维的投影,允许用户识别数据点之间意想不到的关系。然后,一系列聚类算法将数据点归类到聚类中。对于每个识别的聚类,都在相应的数据集上训练一个自编码神经网络。目标是在每个自编码模型和测量值之间测量重建误差,从而为在聚类阶段发现的每种状态创建一个接近度索引。
发布时间: 4/8/2025
查看原文
作者: Nusrat Jahan Mozumder, Felipe Toledo, Swaroopa Dola, Matthew B. Dwyer
arXiv:2504.02737v2 通知类型: replace-cross 摘要:深度神经网络(DNN)测试对于关键系统的可靠性和安全性至关重要,其中的失败可能导致严重的后果。尽管已经发展出了多种技术来创建稳健的测试套件,但针对DNN的需求驱动测试仍然很少被探索——然而,这样的测试被认可是关键系统软件验证的一个重要组成部分。在本次工作中,我们提出了一种需求驱动的测试套件生成方法,该方法使用语义特征空间中制定的结构化自然语言需求来通过提示预训练生成模型的文本条件潜在扩散模型生成测试套件,然后利用相关后置条件定义一个测试或acles来判断测试下DNN输出的质量。我们使用微调后的预训练生成模型变体研究了该方法。我们的实验在MNIST、CelebA-HQ、ImageNet和自动驾驶汽车驾驶数据集上表明,生成的测试套件是现实的、多样的、与前置条件一致的,并且能够揭示故障。
发布时间: 4/7/2025
查看原文
arXiv:2504.01043v2 宣告类型: replace-cross 摘要:临床医生有义务向患者披露他们使用医疗机器学习系统的情况,否则被视为一种应当承担责任的道德过错。将这种观点称为“披露论点”。伦理学文献中可以提供或可能提供的支持披露论点的主要论据有四种:基于风险的论据、基于权利的论据、基于实质性因素的论据和基于自主性的论据。在这篇文章中,作者认为这四个论据都不令人信服,因此应当拒绝披露论点。作者建议,强制披露还可能通过为利益相关者提供避免因这些系统不当应用或使用而导致的损害责任的方式,反而对患者造成伤害。
发布时间: 4/7/2025
查看原文
作者: Xindi Yang, Baolu Li, Yiming Zhang, Zhenfei Yin, Lei Bai, Liqian Ma, Zhiyong Wang, Jianfei Cai, Tien-Tsin Wong, Huchuan Lu, Xu Jia
arXiv:2503.23368v3 宣布类型: replace-cross 摘要:近年来,视频扩散模型(VDMs)取得了显著进展,使其能够生成高度逼真的视频,并引起了人们对它们作为世界模拟器的潜力的关注。然而,尽管具有这些能力,VDMs 由于对物理现象缺乏内在的理解,往往无法产生物理上合理的视频,导致不正确的动态和事件序列。为了解决这一局限性,我们提出了一种新颖的两阶段图像到视频生成框架,该框架明确将物理现象与基于视觉和语言的物理先验相结合。在第一阶段,我们采用视觉语言模型(VLM)作为粗粒度的运动规划器,结合思考过程和物理感知的推理,预测近似的运动轨迹/变化,以近似真实世界的物理动力学,同时保证帧间的连贯性。在第二阶段,我们使用预测的运动轨迹/变化来指导VDM的视频生成。由于预测的运动轨迹/变化是粗略的,在推理过程中添加噪声以提供VDM在生成更多细节动作方面的自由度。广泛实验结果表明,我们的框架可以生成物理上合理的运动,并与现有方法的比较评价突显了我们方法的显著优势。更多视频结果可在我们的项目页面上找到:https://madaoer.github.io/projects/physically_plausible_video_generation。
发布时间: 4/7/2025
查看原文
arXiv:2503.22958v2 通知类型: replace-cross 摘要:布局相关的效应(LDEs)对模拟电路性能产生了显著影响。传统上,设计人员依靠电路组件的对称布局来减轻由LDEs引起的变化。然而,由于这些效应的非线性本质,传统的方法往往效果不佳。我们提出了一种以目标为导向的多层次多智能体Q-learning框架,以探索模拟布局的非常规设计空间,从而为优化模拟电路性能开辟新的途径。我们的方法在变异性性能上优于最先进的布局技术。值得注意的是,这是多智能体RL在模拟布局自动化中的首次应用。我们还比较了所提出的方法与基于模拟退火的非ML方法。
发布时间: 4/7/2025
查看原文
作者: Yanliang Huang, Sebastian Mair, Zhuoqi Zeng, Matthias Althoff
arXiv:2503.22925v2 宣布类型: 替换-交叉 摘要:自动驾驶车辆路径规划已经达到了一个关键阶段,安全性和合规性至关重要。本文提出了一种将运动规划器与深度强化学习模型结合起来的方法,以预测潜在的交通规则违规行为。我们的主要创新在于,使用了一个运动规划模块来替换标准的演员网络,从而确保生成稳定且可解释的轨迹。在此设置中,我们使用交通规则的 robustness 作为奖励来训练强化学习代理的批评家,并且批评家的输出直接用作运动规划器的成本函数,以指导轨迹的选择。我们从《德国道路交通法规》中纳入了一些关键的跨州规则,并使用基于图的状态表示来处理复杂的交通信息。在开放的德国高速公路数据集上的实验表明,该模型可以预测并防止超出规划范围的交通规则违规行为,提高了在复杂交通场景中的安全性和规则遵从性。
发布时间: 4/7/2025
查看原文
arXiv:2503.21530v2 更新类型: replace-cross 摘要: 随着信息检索(IR)领域越来越认识到包容性的重要性,满足低资源语言的需求仍是一个重大挑战。尽管印度次大陆广泛使用乌尔都语和罗马化乌尔都语这两种文稿,但它们之间的转写研究仍未得到充分的探索。先前使用RNN(循环神经网络)在Roman-Urdu-Parl数据集上的工作展示了令人鼓舞的结果,但受到了领域适应性差和评估有限的限制。我们提出了一种基于变换器的方法,使用m2m100多语言翻译模型,并结合掩码语言模型(MLM)预训练和在Roman-Urdu-Parl数据集和领域多样化的Dakshina数据集上的微调。为了解决之前评估中的缺陷,我们引入了严格的数据集划分,并使用BLEU、字符级BLEU和CHRF来评估性能。我们的模型在转写性能上表现出色,字符级BLEU得分分别为96.37(乌尔都语->罗马化乌尔都语)和97.44(罗马化乌尔都语->乌尔都语)。这些结果优于RNN基线和GPT-4o Mini,并证明了多语言迁移学习在低资源转写任务中的有效性。
发布时间: 4/7/2025
查看原文