arXiv 论文列表

作者: Md Fahimuzzman Sohan

arXiv:2504.16404v1 交叉文献类型: cross 摘要: 牛蹄病通常是由于蹄部损伤或趾间皮炎引起，导致疼痛并对行走、进食和饮水等基本生理活动产生显著影响。本研究提出了一种基于深度学习的模型，用于利用公开可用的视频数据检测牛蹄病、疾病或步态异常。该数据集包含40头牛的50个独特的视频片段，从室内和室外的不同角度录制。数据集的一半代表自然行走（非跛行）的牛，而另一半则包含表现出步态异常（跛行）的牛。为了增强模型的稳健性和通用性，在训练数据上应用了数据增强。预处理后的视频使用两种深度学习模型：ConvLSTM2D 和 3D CNN进行分类。结果比较分析表明分类性能很强。具体来说，3D CNN 模型在视频级别的分类准确率达到90%，其精确度、召回率和F1分数分别为90.9%、90.9%和90.91%。ConvLSTM2D 模型的准确率略低，仅为85%。本研究强调了直接将分类模型应用于从视频数据中学习时空特征的有效性，提供了一种替代传统多阶段方法的途径，这些方法通常涉及对象检测、姿态估计和特征提取。此外，研究表明，提出的深度学习模型，特别是3D CNN，在简化处理流程的同时，有效地分类和检测了牛的跛行。

发布时间: 4/24/2025

查看原文

Contextual: 通过上下文保留的令牌过滤和知识图谱改进临床文本总结在LLMs中的效果

作者: Fahmida Liza Piya, Rahmatollah Beheshti

arXiv:2504.16394v1 交叉公告类型: 摘要：非结构化的临床数据可以作为独特且丰富的信息来源，有助于临床实践的有意义指导。从这些数据中提取最相关的背景信息对于利用其真正潜力，以最佳和及时的方式进行患者的临床决策至关重要。尽管先前的研究探索了各种临床文本总结方法，但大多数前期研究要么均匀处理所有输入词，要么依赖基于启发式的过滤器，这可能会忽略临床线索的细微之处，并未能优先考虑对决策至关重要的信息。在本研究中，我们提出了一种名为Contextual的新型框架，该框架结合了上下文保留词过滤方法和特定领域的知识图谱(KG)以增强上下文。通过保留特定于上下文的重要词，并以结构化知识丰富它们，Contextual提高了语言连贯性和临床准确性。我们在两个公开基准数据集上的广泛实证评估表明，Contextual始终优于其他基线。我们提出的这种方法突显了词级过滤和结构化检索在提高语言和临床完整性的互补作用，以及提供了一种可扩展的解决方案，以提高临床文本生成的精确度。

发布时间: 4/24/2025

查看原文

PINN-MEP：分子系统中最低能量路径发现的连续神经表示方法

作者: Magnus Petersen, Roberto Covino

arXiv:2504.16381v1 类型: cross 摘要: 在计算科学中，表征物理系统中的构象转变依旧是一个根本性的挑战。传统采样方法如分子动力学（MD）或MCMC在处理分子系统的高维性质以及稳定状态之间高能垒的转换时常常力不从心。尽管这些转换在模拟时间尺度上是非常罕见的事件，但它们通常代表了最具生物意义的过程——例如，离子通道蛋白从关闭状态转变为开放状态的过程，这控制着细胞的离子流量，并对神经信号至关重要。这种在实际系统中的转变可能需要数毫秒到数秒的时间，但在连续模拟中观测一次可能需要数月至数年的计算时间。我们提出了一种方法，将其构象转换路径生成重新构想为通过物理知情神经网络（PINNs）解决的连续优化问题，这些方法受到弦方法用于最小能路径（MEP）生成的启发。通过将构象转换路径表示为隐式神经函数，并利用可微分分子动力学势场的自动微分，我们的方法能够在不需昂贵路径采样的情况下高效地发现物理上现实的转换路径。我们通过对两个蛋白质的示例展示了该方法的有效性，其中包括一个超过8,300个原子的显式水化的牛胰蛋白酶抑制剂（BPTI）系统。

发布时间: 4/24/2025

查看原文

网络触觉：在网络世界中寻找一种无痛可测量的新感觉，以实现计算中的情绪意识

作者: Tadashi Okoshi, Zexiong Gao, Tan Yi Zhen, Takumi Karasawa, Takeshi Miki, Wataru Sasaki, Rajesh K. Balan

arXiv:2504.16378v1 宣告类型: 交叉摘要：在情绪计算中，准确识别用户的情绪是有效的人机情绪交互的基础。理解用户的内感受有助于更好地了解个体间不同的情绪能力，这对于实现个体间准确的情绪估计至关重要。然而，现有的内感受测量方法，如心率辨别任务，具有多个局限性，包括依赖于严格控制的实验室环境和精密仪器，这使得监测用户的内感受具有挑战性。本研究旨在确定其他形式的数据，可以解释用户在日常生活中的内感受或类似状态，并提出一种新的假设概念“赛博感受”，这是一种新感受（1）在与其他情绪相关能力的相关性方面具有类似于内感受的属性；（2）仅可通过用户日常生活中嵌入在智能手机设备中的传感器进行测量。为期10天的实验室/野外混合实验结果表明，一种特定的赛博感受类型“启动生成”（用户对自己智能手机重启行为频率的主观感觉），与参与者的情绪强度显著相关。我们期望赛博感受能够成为开发更“情绪感知”和用户友好的应用和服务的基础构建块。

发布时间: 4/24/2025

查看原文

CLPSTNet：一种结合渐进式学习的多尺度卷积隐写模型

作者: Fengchun Liu, Tong Zhang, Chunying Zhang

arXiv:2504.16364v1 类别: cross 摘要: 近年来，大量研究将卷积神经网络（CNNs）引入图像隐写术，将传统的手工特征和先验知识设计转化为神经网络自主学习信息嵌入的隐写术方法。然而，由于数字图像的内在复杂性，在使用CNN模型进行信息嵌入时，透明性和安全性的问题依然存在。在本文中，我们提出了一种逐步学习渐进隐写网络（CLPSTNet）。该网络由多个逐步多尺度卷积模块组成，这些模块结合了Inception结构和膨胀卷积。模块包含多个分支路径，从较小的卷积核和膨胀率开始，从特征图中提取基本的局部特征信息，并逐步扩大到较大的卷积核和膨胀率的卷积，以感知更大感受野的特征信息，从而实现从浅层到深层，从精细到粗糙的多尺度特征提取，使得浅层的秘密信息特征能够在不同的融合阶段得到细化。实验结果表明，提出的CLPSTNet不仅在ALASKA2、VOC2012和ImageNet三个大型公开数据集上具有高PSNR、SSIM指标和解码准确性，而且使用CLPSTNet生成的隐写图像具有较低的分析分数。您可以在以下链接找到我们的代码：\href{https://github.com/chaos-boops/CLPSTNet}{https://github.com/chaos-boops/CLPSTNet}

发布时间: 4/24/2025

查看原文

DP2FL: 双Prompt个性化联邦学习在基础模型中

作者: Ying Chang, Xiaohu Shi, Xiaohui Zhao, Zhaohuang Chen, Deyin Ma

arXiv:2504.16357v1 类型: cross 摘要: 个性化联邦学习（PFL）因其能够处理异构客户端数据分布并保留数据隐私的能力而受到了广泛关注。然而，当本地客户端数据有限时，深度学习模型往往遭受训练不足的影响，导致性能不佳。基础模型，如CLIP（对比语言-图像预训练），具有强大的特征提取能力，并且可以通过在有限的本地数据上进行微调来缓解这一问题。尽管这些基础模型有着巨大的潜力，但在联邦学习场景中利用它们的情况却很少见，且与新客户端集成相关的挑战依然亟待解决。为应对这些挑战，我们提出了双重提示个性化联邦学习（DP2FL）框架，该框架引入了双重提示和自适应聚合策略。DP2FL 结合了全局任务意识和基于本地数据的见解，使本地模型能够实现有效的泛化，同时保持对特定数据分布的适应性。此外，DP2FL 引入了一个全局模型，该模型能够在新数据源上进行预测，并无缝集成新添加的客户端而无需重新训练。在高度异构环境中的实验结果验证了DP2FL 提示设计和聚合策略的有效性，强调了新数据源预测的优势，并展示了新客户端无缝集成到联邦学习框架中的能力。

发布时间: 4/24/2025

查看原文

基于变压器的从美国法典中提取法定定义

arXiv:2504.16353v1 宣布类型: cross 摘要: 自动从法律文本中提取定义对于增强复杂的法律语料库（如美国法典（U.S.C.））的可读性和清晰度至关重要。我们提出了一种先进的自然语言处理系统，利用基于Transformer的架构自动从美国法典中提取定义术语、其定义及其范围。我们解决了自动识别法律定义、提取定义术语以及在这一复杂的20多万页联邦法规语料库中确定其范围的挑战。在之前的特征基于机器学习方法的基础上，我们更新的模型采用专门针对法规文本训练的领域特定Transformer（Legal-BERT），显著提高了提取准确性。我们的工作实现了一种多阶段管道，结合了文档结构分析和最先进的语言模型，处理来自美国法典XML版本的法律文本。首先，每段文本都使用微调的法律领域BERT模型进行分类，以确定是否包含定义。然后，系统将相关段落聚合为连贯的定义单元，并应用注意力机制和基于规则的模式来提取定义术语及其管辖范围。定义提取系统在包含数千个定义的美国法典多个标题上进行了评估，证明了与先前方法相比有显著改进。我们的最佳模型达到了96.8%的精确率、98.9%的召回率（F1分数为98.2%），远超传统机器学习分类器。这项工作有助于提高法律信息的可访问性和理解度，并为下游法律推理任务奠定基础。

发布时间: 4/24/2025

查看原文

在缺失模态场景中的模态解耦与生成推荐

作者: Jiwan Kim, Hongseok Kang, Sein Kim, Kibum Kim, Chanyoung Park

arXiv:2504.16352v1 类别：交叉学科摘要：多模态推荐系统（MRSs）通过利用图像、文本和音频等多种模态，在提高个性化方面取得了显著成功。然而，仍然存在两个关键挑战未得到充分解决：（1）对缺乏模态场景考虑不足以及（2）忽视了模态特征的独特性。这些挑战导致在实际场景中缺乏模态时，推荐性能显著下降。为了解决这些问题，我们提出了Disentangling and Generating Modality Recommender（DGMRec）这一全新的框架，专门针对缺乏模态场景。DGMRec从基于信息的角度将模态特征分解为通用模态特征和特定模态特征，从而使推荐具有更加丰富的表示。在此基础上，它通过整合其他模态的对齐特征并利用用户的模态偏好来生成缺失的模态特征。广泛的实验结果显示，在包括缺失模态和新项目设置以及多样化的缺失比率和不同级别的缺失模态在内的各种挑战场景中，DGMRec始终优于最新的MRSs。此外，DGMRec基于生成的方法能够实现跨模态检索，这是现有的MRSs无法完成的任务，突显了其适应性和在实际应用中的潜力。我们的代码可在https://github.com/ptkjw1997/DGMRec 获取。

发布时间: 4/24/2025

查看原文

QAOA-GPT: 有效地生成自适应和规则的量子近似优化算法电路

作者: Ilya Tyagin, Marwa H. Farag, Kyle Sherbert, Karunya Shirali, Yuri Alexeev, Ilya Safro

arXiv:2504.16350v1 类型: cross 摘要：量子计算有可能通过提供在特定条件下可能提供加速的新算法方法，来提高我们解决某些计算上困难的优化问题的能力。在这种工作中，我们引入了QAOA-GPT，这是一个生成框架，利用生成预训练变压器（GPT）直接合成量子电路以解决二次无约束二进制优化问题，并在图上的MaxCut问题上进行了演示。为了多样化训练电路并确保其质量，我们使用了适应性QAOA方法生成了一个合成数据集，这是一种逐步构建和优化特定问题电路的方法。对一个精心选择的图实例集进行的实验表明，QAOA-GPT能够为未在训练中出现的新问题实例生成高质量的量子电路，并成功参数化QAOA。我们的结果显示，使用QAOA-GPT生成量子电路将显著减少经典QAOA以及常用梯度评估生成电路和电路参数的经典优化的计算开销。我们的工作表明，生成式AI可能是以可扩展的方式生成紧凑量子电路的一个有前途的方法。

发布时间: 4/24/2025

查看原文

从软件仓库中挖掘专家推荐

作者: Chad Marshall, Andrew Barovic, Armin Moin

arXiv:2504.16343v1 分类: cross 摘要: 我们提出了一种自动化的故障分配方法，用于大型开源软件项目中的开发人员。这样，我们可以通过辅助负责寻找最适合特定领域的开发人员来处理新报告的问题的bug检视员，从而帮助他们。我们的方法基于在问题跟踪系统中记录的软件开发历史。我们使用BERTopic和TopicMiner的技术。我们的方法是基于bug报告的功能，如对应的产物和组件，以及它们的优先级和严重程度级别。我们根据开发人员对特定新报告组合的经验对其排名。评价使用Top-k精度进行，结果与前作中的TopicMiner MTM、BUGZIE、基于深度强化学习的bug检视BT-RL以及LDA-SVM进行了比较。评价数据来自各种Eclipse和Mozilla项目，如JDT、Firefox和Thunderbird。

发布时间: 4/24/2025

查看原文