arXiv 论文列表

基于时间特征提取的混合高斯过程回归在航空发动机剩余使用寿命区间预测中的部分可解释性研究

作者: Tian Niu, Zijun Xu, Heng Luo, Ziqing Zhou

剩余使用寿命（RUL）的估计在智能制造系统和工业4.0技术中起着关键作用。虽然最近的进展提高了RUL预测的准确性，但许多模型仍然面临可解释性和令人信服的不确定性建模挑战。本文介绍了一种改进的高斯过程回归（GPR）模型，用于RUL区间预测，该模型针对制造过程开发的复杂性进行了定制。改进后的GPR通过学习历史数据来预测置信区间，并以更结构化的方式解决不确定性建模问题。该方法通过将GPR与深度自适应学习增强的AI过程模型相结合，有效地捕捉了现代制造系统中固有的复杂时间序列模式和动态行为。此外，该模型评估特征重要性以确保更透明的决策，这对于优化制造过程至关重要。这种综合方法支持更准确的RUL预测，并提供对不确定性的透明、可解释的见解，有助于强大的过程开发和管理。

发布时间: 11/26/2024

查看原文

约束多属性分子优化中属性优化和约束满足的平衡

作者: Xin Xia, Yajie Zhang, Xiangxiang Zeng, Xingyi Zhang, Chunhou Zheng, Yansen Su

分子优化旨在从巨大的化学搜索空间中发现改进的分子，是化学发展中的关键步骤。各种人工智能技术已在分子优化任务中展现出高效性。然而，这些技术中很少有关注在属性优化与约束满足之间的平衡，这使得难以获得既具有理想属性又满足各种约束的高质量分子。为了解决这个问题，我们提出了一种约束性多属性分子优化框架（CMOMO），这是一种灵活高效的方法，可以同时优化多种分子属性，同时满足多种药物样约束。CMOMO基于动态协同优化改进具有约束的分子多重属性，该方法动态处理各种场景下的约束。此外，CMOMO在隐式分子空间内，通过分子的进化，在离散化学空间内协同评估多个属性，以指导进化搜索。实验结果表明，在同时优化多种非生物活性属性并满足两种结构约束的两个基准任务上，所提出的CMOMO优于五种最先进的分子优化方法。此外，CMOMO在两个实际任务中得到了验证，它识别出一组β2-肾上腺素受体GPCR的候选配体和糖原合酶激酶-3β的高性能候选抑制剂，并满足药物样约束。

发布时间: 11/26/2024

查看原文

人才招聘平台应用数量预测：利用大型语言模型挖掘多模态信号

作者: Md Ahsanul Kabir, Kareem Abdelfatah, Shushan He, Mohammed Korayem, Mohammad Al Hasan

随着招聘和人才获取竞争日益激烈，招聘公司在使用机器学习 (ML) 方法优化日常活动方面变得越来越复杂。但是，该领域大多数已发表的基于 ML 的方法仅限于候选人匹配、职位技能匹配、职位分类和规范化等任务。在这项工作中，我们讨论了招聘领域的一项新任务，即申请数量预测，其动机来自设计有效的拓展活动以吸引合格的申请人。我们表明，现有的基于自回归的时间序列预测方法在此任务中表现不佳。因此，我们提出了一种基于多模态大型语言模型 (LM) 的模型，该模型通过简单的编码器融合了各种模态的职位发布元数据。来自 CareerBuilder LLC 的大型真实数据集的实验表明，该方法优于现有的最先进方法。

发布时间: 11/26/2024

查看原文

基于全组学和部分组学数据的癌症亚型分型多层矩阵分解

作者: Yingxuan Ren, Fengtao Ren, Bo Yang

癌症具有内在的异质性，通常根据其独特的特征、细胞起源和每种类型特有的分子标记将其分为不同的亚型。然而，目前的研究所依赖的主要是完整的组学多组学数据集来预测癌症亚型，往往忽略了在某些组学数据可能缺失的情况下的预测性能，并且忽略了多层组学数据整合中的隐含关系。本文介绍了一种用于癌症亚型分类的新方法——多层矩阵分解法(MLMF)，该方法采用多组学数据聚类。MLMF首先通过多层线性或非线性分解处理多组学特征矩阵，将原始数据分解成每个组学类型特有的潜在特征表示。随后，这些潜在表示被融合成一种一致的形式，然后进行谱聚类以确定亚型。此外，MLMF还结合了类别指示矩阵来处理缺失的组学数据，创建了一个统一的框架，可以管理完整和不完整的组学多组学数据。在10个完整的和缺失值的组学多组学癌症数据集上进行的大量实验表明，MLMF取得的结果与几种最先进的方法相比，具有可比性甚至超越了它们的性能。

发布时间: 11/26/2024

查看原文

利用规模和物理规律：一种用于任意几何形状偏微分方程的多图神经算子框架

作者: Zhihao Li, Haoze Song, Di Xiao, Zhilu Lai, Wei Wang

偏微分方程 (PDE) 是许多科学现象的基础，但传统的计算方法往往难以处理复杂的非线性系统和不规则几何形状。本文介绍了 AMG 方法，这是一种用于高效求解任意几何形状上偏微分方程的多图神经算子方法。AMG 利用基于图的先进技术和动态注意力机制，在一个新颖的 GraphFormer 架构中，能够精确地管理不同的空间域和复杂的数据相互依赖关系。通过构建多尺度图来处理可变特征频率以及物理图来封装固有的物理属性，AMG 显著优于以往的方法，而以往的方法通常局限于均匀网格。我们在六个基准测试中对 AMG 进行了全面的评估，证明了其相对于现有最先进模型的一致优越性。我们的研究结果突出了定制图神经算子在克服传统 PDE 求解器面临的挑战方面的变革潜力。我们的代码和数据集可在 \url{https://github.com/lizhihao2022/AMG} 获取。

发布时间: 11/26/2024

查看原文

开源大型语言模型能否增强毒性检测的数据增强？一项实验研究

作者: Zheng Hui, Zhaoxiao Guo, Hang Zhao, Juanyong Duan, Lin Ai, Yinheng Li, Julia Hirschberg, Congrui Huang

高质量、多样化的有害数据对于解决内容审核中的实时应用至关重要。目前使用GPT系列模型进行有害内容检测的最先进方法成本高昂且缺乏可解释性。本文研究了在开源大型语言模型（LLM）上使用提示工程和微调技术来增强有害数据增强的应用，特别是针对有害内容检测。我们进行了一个两阶段的实证研究，第一阶段评估了六个开源LLM在多个数据集上的表现，仅使用提示工程；第二阶段侧重于微调。我们的研究结果表明，Mistral模型能够在产生有害数据的同时最大限度地减少幻觉。虽然微调这些模型可以提高数据质量和多样性，但数据重复和过拟合等挑战依然存在。我们的实验结果突出了增强有害内容检测系统的可扩展、经济高效的策略。这些发现不仅证明了开源LLM在创建强大的内容审核工具方面的潜力，而且该方法在实际工业场景中的应用进一步证明了微调后的开源LLM用于数据增强的可行性和效率。我们希望我们的研究能够帮助理解当前模型在有害内容检测方面的能力和局限性，并推动该领域的进一步发展。

发布时间: 11/26/2024

查看原文

异构数据流下的去中心化测试时自适应

作者: Zixian Su, Jingwei Guo, Xi Yang, Qiufeng Wang, Kaizhu Huang

尽管测试时自适应（TTA）在解决训练数据和测试数据之间分布差异方面显示出前景，但由于统一的目标估计，其有效性在异构数据流中会下降。之前的尝试仅仅稳定模型随时间的微调以处理不断变化的环境，它们从根本上假设任何时刻的目标域都是同质的，从而未解决现实世界数据固有的异质性。本文深入研究了异构数据流下的TTA，超越了当前以模型为中心的局限性。从数据中心的视角重新审视TTA，我们发现将样本分解到傅里叶空间有助于准确地分离不同频率级别的各个数据。基于此洞见，我们提出了一种新颖的基于频率的去中心化自适应（FreDA）框架，该框架将数据从傅里叶空间的全局异构转换为局部同构，并采用去中心化自适应来管理不同的分布偏移。有趣的是，我们设计了一种新颖的基于傅里叶变换的数据增强策略来辅助去中心化自适应，该策略单独增强样本质量以捕获每种类型的分布偏移。在各种环境（损坏的、自然的和医疗环境）中进行的大量实验表明，我们提出的框架优于现有技术。

发布时间: 11/26/2024

查看原文

仿蜂群觅食的传感器自适应部署：迈向高效的环境监测

作者: Sai Krishna Reddy Sathi

本文旨在为可持续机器人技术领域做出贡献，在该领域，需要高效的算法来有效地执行环境监测和精准农业等任务。我们提出了一种混合算法，该算法结合了人工蜂群算法 (ABC) 和 Lévy 飞行，以优化自适应传感器布局，并结合了领域专家提供的热点概念。通过增强探索和利用，我们的方法显著提高了关键热点的识别能力。该算法还可用于更广泛的搜索和救援行动，展示了其在各个领域的优化问题中的潜力。

发布时间: 11/26/2024

查看原文

基于记忆的元启发式算法：改进优化性能

作者: Salar Farahmand-Tabar

元启发式算法是模拟自然过程以寻找复杂问题最优解的随机优化算法。元启发式算法的成功很大程度上取决于有效探索和利用搜索空间的能力。为了增强性能，一些流行的元启发式算法中引入了记忆机制。本章探讨了记忆在元启发式算法中的重要性，并提供了来自知名算法的见解。本章首先介绍记忆的概念及其在元启发式算法中的作用。讨论了影响记忆机制有效性的关键因素，例如记忆的大小、存储在记忆中的信息以及信息衰减率。本章对如何将记忆机制融入流行的元启发式算法进行了全面分析，最后强调了记忆在元启发式性能中的重要性，并为改进记忆机制提供了未来的研究方向。关键结论是：记忆机制可以通过有效且高效地探索和利用搜索空间来显著增强元启发式算法的性能；并且记忆机制的选择应该根据问题领域和搜索空间的特性进行调整。

发布时间: 11/26/2024

查看原文

人工智能法案中的基本权利影响评估（FRIA）：根源、法律义务及模型模板的关键要素

作者: Alessandro Mantelero

欧盟人工智能法案中开展基本权利影响评估（FRIA）的义务缘何产生？欧盟立法者在人工智能法案中如何界定对基本权利影响的评估？制定FRIA应遵循哪些方法论标准？本文旨在通过对人工智能法案相关条款的法律分析以及对人工智能对基本权利影响评估的各种可能模型的讨论，解答这三个主要研究问题。本文的总体目标是填补人工智能法案中概述的FRIA理论和方法论阐述中存在的空白。为了促进欧盟和国家机构以及人工智能运营商未来的工作，将这一以人为本、值得信赖的人工智能的关键工具置于欧盟人工智能设计和开发方法的核心地位，本文概述了FRIA模型模板的主要构成要素。虽然该提案与人工智能法案的理由和范围相符，但也适用于第27条所列情况以外的情况，并可作为其他国家和国际监管举措的蓝图，以确保人工智能完全符合人权。

发布时间: 11/26/2024

查看原文