arXiv:2505.09262v1 宣传类型: cross
摘要: 当前的分子机器学习力场(MLFFs)通常专注于学习原子、分子和简单的量子化学性质(如能量和力),但忽视了在准确理解分子力场(MFFs)方面电子密度(ED)$\rho(r)$的重要性。ED描述了在特定位置周围找到电子的概率,根据Hohenberg-Kohn定理,它唯一地确定了相互作用多粒子系统的所有基态性质(如能量、分子结构等)。然而,计算ED依赖于耗时的第一性原理密度泛函理论(DFT),这导致了大规模ED数据的缺乏,并限制了其在MLFFs中的应用。在本文中,我们引入了EDBench,这是一个大规模、高质量的电子尺度电子密度数据集,旨在推动基于学习的研究。基于PCQM4Mv2构建,EDBench提供了准确的电子密度数据,涵盖了330万种分子。为了全面评估模型理解和利用电子信息的能力,我们设计了一系列以电子密度为中心的基准任务,涵盖预测、检索和生成。对我们所测试的几种最先进的方法的评估表明,从EDBench学习不仅是可行的,而且可以实现高精度。此外,我们展示了基于学习的方法可以在保持相近精度的同时,显著降低计算成本,相对于传统的DFT计算。EDBench的所有数据和基准数据将免费提供,为基于电子密度的药物发现和材料科学奠定了坚实的基础。
arXiv:2505.09246v1 Announce Type: cross
摘要:在许多现实场景中,机器学习模型和交互系统可以访问结构化知识,例如知识图或表格,以及未结构化内容,例如自然语言文档。然而,大多数情况下它们仅依赖于其中一种。半结构化知识库(SKBs)通过将未结构化内容链接到结构化数据中的节点来弥合这一差距,从而为知识访问和使用提供了新的策略。在本文中,我们提出了FocusedRetriever,这是一种基于SKB的模块化框架,用于多跳问答。它通过将基于VSS的实体搜索、基于LLM生成Cypher查询和成对再排序的组件进行整合,使其能够在STaRK基准测试集的所有三个测试集中超过最先进的方法,覆盖了多个领域和多种性能指标。其首次命中率平均超出第二好方法25.7%。FocusedRetriever利用了(1)大语言模型(LLMs)提取未结构化文本中的关系事实和实体属性的能力,(2)节点集连接来根据这些提取的三元组和约束过滤答案候选者,(3)向量相似性搜索来检索和排名相关的未结构化内容,以及(4)大语言模型的上下文能力最终排名前k个答案。为了通用性,我们仅在评估中将基础LLM纳入了FocusedRetriever中。然而,我们对中间结果的分析强调了进一步升级的机会,包括微调。相关源代码可以在https://github.com/kramerlab/FocusedRetriever 公开获取。
arXiv:2505.09208v1 类型:交叉
摘要:随着生成式人工智能(AI)的迅猛发展,其在高等教育领域的潜在应用引起了广泛关注。本研究调查了来自中国不同工程学科和地区共计148名学生使用生成式AI的情况,重点关注其对学习体验的影响以及在工程教育中所带来的机会和挑战。根据调查数据,我们探讨了四个关键领域:工程学生成使用生成式AI的频率和应用场景、其对学生学习和表现的影响、使用生成式AI时常见的挑战、以及生成式AI在工程教育中的未来前景。结果显示,超过一半的参与者报告称生成式AI对其学习效率、积极性和创造力产生了积极影响,近一半的人认为它还增强了学生的独立思考能力。尽管承认学习效率有所提高,但许多学生感到实际学术表现变化不大,并对生成式AI的准确性和特定领域的可靠性表示担忧。我们的研究结果提供了对生成式AI当前对学生,尤其是中国工程学生带来的益处和挑战的直接洞察,并从学生视角提出了多项建议,以有效整合生成式AI于工程教育中。
arXiv:2505.09203v1 逆向设计类型: 交叉
摘要: 开发出具有特定性能的功能材料的逆向设计方法对于推进可再生能源、催化、能量存储和碳捕获等领域至关重要。基于扩散原理的生成模型可以直接生成满足性能要求的新材料,从而显著加速材料设计过程。然而,现有生成和预测晶体结构的方法往往受限于较低的成功率。在这项工作中,我们提出了一种基于主动学习策略的新颖逆向材料设计生成框架,称为InvDesFlow-AL。该框架可以迭代优化材料生成过程,逐步引导其向所需的性能特征靠拢。在晶体结构预测方面,InvDesFlow-AL 模型实现了0.0423 Å 的 RMSE,相比现有生成模型性能提升32.96%。此外,InvDesFlow-AL 已成功验证了低形成能和低Ehull材料的设计。它可以系统地生成逐步降低形成能的材料,同时不断扩展在各种化学空间中的探索范围。这些结果充分证明了基于主动学习的生成模型在加速材料发现和逆向设计方面的有效性。为进一步证明该方法的有效性,我们以InvDesFlow-AL 探索的常压下寻找BCS超导体为例。最终,我们成功识别了Li₂AuH₆作为一种常压下超高的BCS超导体,其转变温度为140 K。这一发现为在材料科学中应用逆向设计提供了强有力的实证支持。
arXiv:2505.09168v1 编码类型: cross
摘要:伪装目标检测(COD)的核心挑战在于目标与背景在颜色、纹理和形状方面的难以区分的相似性。这导致现有方法要么因为过度依赖全局语义信息而丢失边缘细节(如发丝般的细结构),要么在仅依赖局部特征时被相似的背景干扰(如植被模式)。我们提出了一种名为DRRNet的四位结构体系,其特征在于“上下文-细节-融合-精炼”管道,以解决这些问题。具体来说,我们引入了一个全方位上下文特征提取模块来捕获全局伪装模式,并引入了一个局部细节提取模块来补充全场景上下文模块中的微结构信息。然后,我们设计了一个模块来形成场景理解和结构意识的双重表示,该模块融合了不同尺度的全景特征和局部特征。在解码器中,我们还引入了一个逆精炼模块,利用空间边缘先验和频域噪声抑制,对输出进行两级逆精炼。通过连续两次逆精炼,模型有效地抑制了背景干扰并增强了对象边界的连续性。实验结果表明,DRRNet在基准数据集上显著优于现有的最先进的方法。我们的代码可在https://github.com/jerrySunning/DRRNet获取。
arXiv:2505.09166v1 类别: cross
摘要: 在文本生成图像(TTI)的创意实践中,图像是从文本提示生成的。然而,TTI 模型在训练时会始终生成输出,即使提示中包含未知术语。在这种情况下,模型可能会生成我们称之为“默认图像”的图像:这些图像在许多不相关的提示之间彼此高度相似。我们主张研究默认图像对于设计更好的 TTI 解决方案和提示工程具有价值。在本文中,我们对 Midjourney 进行了首次默认图像的研究,Midjourney 是一个流行的图像生成器。我们描述了我们系统的方法来创建触发默认图像的输入提示,并展示了我们初步实验和几个小型消融研究的结果。我们还报告了一项关于默认图像如何影响用户满意度的调查研究。我们的工作为理解 TTI 中的默认图像奠定了基础,并突显了挑战和未来的研究方向。
arXiv:2505.09160v1 交叉类型: cross
摘要: 当前自监督学习在无线信道表示的应用中,通常借鉴文本和图像处理领域的发展成果,而未能充分解决无线通信的特殊特性和约束条件。为填补这一空白,我们首先提出了WiMAE(无线屏蔽自编码器),这是一种基于变压器的编码器-解码器基础模型,预训练于一个现实的开源多天线无线信道数据集上。以此为基础,我们进一步开发了ContraWiMAE,该模型通过在统一的多任务框架中结合对比学习目标与重构任务来增强WiMAE。通过从预训练的WiMAE权重开始,并通过噪声注入生成正样本对,对比学习组件使模型能够捕捉结构和判别性特征,从而超越单独重构所能达到的表示质量。通过在未见过的场景中进行广泛评估,我们展示了两种方法在多个下游任务中的有效性,ContraWiMAE在多种无线环境中进一步提高了线性可分性和适应性。与当前最先进的无线信道基础模型进行比较评估,证实了我们模型的优越性能和数据效率,突显了它们作为未来自监督无线信道表示学习研究的强大基准的潜力。
arXiv:2505.09142v1 公告类型:交叉
摘要:我们提出了ELIS,一个大型语言模型(LLMs)的服务系统,该系统配备了一种迭代剩余时间最短优先(ISRTF)调度器,旨在高效管理剩余最少量的推理任务。当前的LLM服务系统通常采用先到先服务的调度策略,这可能导致“排队头阻塞”问题。为克服这一局限性,有必要预测LLM的推理时间,并应用最短任务优先调度策略。然而,由于LLMs的自回归特性,预测推理延迟颇具挑战性。ELIS通过使用BGE模型训练LLMs的响应长度预测器来应对这一挑战,BGE是一种基于编码器的先进模型。此外,我们还开发了ISRTF调度策略,这是对现有LLM迭代批处理的最短剩余时间优先的一种优化。为了在实际使用场景中评估我们的工作,我们根据实际用户的LLM服务跟踪记录模拟了请求流。同时,我们在Kubernetes上实现了ELIS作为云原生调度器系统,以评估其在生产环境中的性能。实验结果表明,ISRTF将平均任务完成时间减少了最多19.6%。
arXiv:2505.09131v1 宣告类型: cross
摘要:聚类中的算法公平性旨在根据给定的敏感属性平衡分配到每个聚类的实例比例。虽然最近开发的公平聚类算法在特定公平性约束下优化聚类目标,但它们固有的复杂性或近似性通常会导致实践中聚类效用不佳或数值不稳定。为了解决这些限制,我们提出了一个基于公平K均值聚类目标函数新颖分解的新公平聚类算法。所提出的算法称为通过对齐实现公平聚类(FCA),它通过交替进行以下步骤运行:(i) 找到一个联合概率分布以对齐来自不同受保护群体的数据,和(ii) 在对齐的空间中优化聚类中心。FCA的一个关键优势是理论上可以保证在任何给定公平性水平下获得近似最优的聚类效用,从而在实践中实现高效用公平聚类。实验表明,FCA在以下方面优于现有方法:(i) 达到了公平水平和聚类效用之间的更优权衡,且(ii) 实现了近完美的公平性而没有数值不稳定。
arXiv:2505.09129v1 宣告类型: cross
摘要: 将传统的深度学习模型部署在高风险安全任务的无标签、数据不可利用的视频智能环境中面临着重大挑战。本文提出了一种轻量级的基于颜色特征的异常检测框架,适用于高敏感度战术任务的监视视频片段,旨在在资源受限和数据敏感条件下迅速识别和解释潜在的威胁事件。该方法将无监督的KMeans聚类与RGB通道直方图建模相结合,以在关键帧中实现结构异常和颜色突变信号的综合检测。实验以一个发生在非洲国家的运作监控视频为研究样本,在无法访问原始数据的情况下,成功识别了多个与高能光源、目标存在和反射性干扰相关的高度异常帧。结果表明,该方法可以有效地应用于战术暗杀预警、可疑物体筛查以及环境突变监控,具有较强的部署性和战术解释价值。研究强调了颜色特征作为低语义战场信号载体的重要性,并指出未来通过结合图神经网络和时间建模,其战场智能感知能力将进一步增强。