arXiv 论文列表

基于 nearest neighbor 方法与机器学习技术结合的门级网表硬件木马位置快速准确识别方法

作者: Anindita Chattopadhyay, Siddharth Bisariya, Vijay Kumar Sutrakar

arXiv:2501.16347v2 宣告类型: 替换-交叉摘要：在集成电路设计不断演进的背景下，检测多实体基于的设计周期中的硬件木马（HTs）面临重大挑战。本研究提出了一种基于机器学习的方法，用于在门级网表中识别恶意逻辑门。该方法侧重于路径重溯算法。该方法在三个不同的案例中得到了验证，每个案例都采用了不同的机器学习模型来分类HTs。案例I利用决策树算法进行节点对节点的比较，并通过集成主成分分析（PCA）显著提高检测准确性。案例II引入了使用图神经网络（GNN）模型的图到图分类，使正常电路设计和受木马感染电路设计之间能够区分。案例III应用基于GNN的节点分类来识别单独的受感染节点及其位置。此外，在案例II中，最近邻（NN）方法与GNN图到图分类结合使用；在案例III中，NN方法与GNN节点到节点分类结合使用。尽管GNN模型在图到图分类上具有潜力，但NN方法表现更佳，第一个最近邻（1st NN）的准确率为73.2%，第二个最近邻（2nd NN）方法的准确率为97.7%。相比之下，GNN模型的准确率为62.8%。同样，在GNN模型节点到节点分类上，NN方法也表现更佳，第一个最近邻（1st NN）的准确率为93%，第二个最近邻（2nd NN）方法的准确率为97.7%。相比之下，GNN模型的准确率为79.8%。然而，更高的NN方法将导致对HTs识别的代码覆盖率增加。

发布时间: 4/29/2025

查看原文

无监督番茄裂纹异常检测基于高光谱成像和变分自编码器

作者: Mahmoud Abdulsalam, Usman Zahidi, Bradley Hurst, Simon Pearson, Grzegorz Cielniak, James Brown

arXiv:2501.02921v2 通告类型: 交叉替换摘要：番茄异常/损伤在温室农业中构成了重大挑战。虽然这种种植方法有利于资源的有效利用，但异常现象会显著降低农产品的质量。与番茄相关的常见异常是开裂，表现为番茄表皮上出现裂缝，这会降低其质量。检测这种类型的异常具有挑战性，因为外观和大小的变化动态多样，并且受到数据集稀缺性的进一步影响。我们通过利用具有超光谱输入的定制变分自编码器(VAE)以无监督的方式解决了这个问题。初步分析数据集使我们能够选择合适的波长范围来检测这种异常。我们的研究结果表明，530nm - 550nm波长范围适用于识别番茄干裂。所提出的VAE模型在测试数据中实现了97%的番茄开裂异常检测准确率。对重构损失的分析不仅有助于检测异常，还能在一定程度上估计异常区域。

发布时间: 4/29/2025

查看原文

基于大型模型投票的机器人process自动化

作者: Osama Abdellatif, Ahmed Ayman, Ali Hamdi

arXiv:2412.17965v2 通知类型：替换-交叉摘要：自动化大规模无结构数据处理对于运营效率至关重要。光学字符识别（OCR）至关重要，但往往在复杂布局和含糊不清的文本方面难以保证准确性和效率。这些挑战在需要速度和精度的大型任务中尤为突出。本文提出了基于大型模型投票的机器人流程自动化系统（LMV-RPA）以增强OCR工作流程。LMV-RPA 将Paddle OCR、Tesseract OCR、Easy OCR 和 DocTR等OCR引擎的输出与LLM（大型语言模型）如LLaMA 3和Gemini-1.5-pro集成。利用多数投票机制，将OCR输出转换为结构化的JSON格式，提高准确性，特别是在复杂布局方面。多阶段管道流程通过LLM处理OCR引擎提取的文本，结合结果以确保最准确的输出。LMV-RPA 在OCR任务中的准确率达到99%，超过了基准模型94%的准确率，同时将处理时间减少了80%。基准评估证实了其可扩展性，并展示了LMV-RPA 为自动化大规模文件处理任务提供的更快、更可靠、更高效的解决方案。

发布时间: 4/29/2025

查看原文

LiveIdeaBench: 评估大语言模型在科学创意生成方面的发散思维能力（最少背景情况下）

作者: Kai Ruan, Xuan Wang, Jixiang Hong, Peng Wang, Yang Liu, Hao Sun

arXiv:2412.17596v3 公告类型: replace-cross 摘要:虽然大型语言模型（LLMs）在科学任务中展现了显著的能力，如文献分析和实验设计（例如，准确提取论文中的关键发现或生成连贯的实验程序），现有的评价基准主要通过丰富的上下文输入来评估性能。我们引入了LiveIdeaBench，这是一个全面的基准测试，通过使用单关键词提示评估发散思维能力来评估LLMs的科学构想生成能力。该基准测试借鉴Guilford的创造力理论，利用最先进的LLM动态面板，从原创性、可行性、流畅性、灵活性和清晰度五个关键维度评估生成的构想。通过在1,180个关键词覆盖22个科学领域的40多个领先模型中进行广泛的实验，我们发现由我们的基准测试测量的科学构想生成能力，难以用一般智能的标准指标来预测。我们的结果表明，尽管像QwQ-32B-preview这样的模型在一般智能得分上有显著差距，但其创造力表现可与顶级模型claude-3.7-sonnet:thinking媲美。这些发现突出了为科学构想生成专门设计的评估基准的需求，暗示增强LLMs的这些构想生成能力可能需要与提高一般问题解决能力不同的训练策略，这可能使不同阶段的科学过程更广泛地使用定制的AI工具。

发布时间: 4/29/2025

查看原文

TrainMover: 一个抗中断且可靠的机器学习训练运行时

作者: ChonLam Lao, Minlan Yu, Aditya Akella, Jiamin Cao, Yu Guan, Pengcheng Zhang, Zhilong Zheng, Yichi Xu, Ennan Zhai, Dennis Cai, Jiaqi Gao

arXiv:2412.12636v2 宣告类型: replace-cross 摘要：大规模机器学习训练任务经常因硬件和软件异常、故障和管理事件而中断。现有的解决方案如检查点或运行时重新配置会遭受长时间宕机、性能下降或训练策略不理想的改变。我们提出了TrainMover，这是一种具备韧性的运行时，它利用备用机器来处理中断，并实现最小的宕机时间和零内存开销。为了实现这些目标，TrainMover引入了两种关键技术：基于两阶段和Delta的通信组设置以及无通信的沙箱化阴影迭代。我们的评估显示，在迁移过程中，TrainMover可以保持所有评价模型的二级级别的低宕机率，同时在定期的10分钟重新平衡期间保持99%的训练效率。我们还展示了TrainMover在处理各种中断方面的有效性。

发布时间: 4/29/2025

查看原文

利用大规模语言模型进行文本属性图的有效无标签节点分类

作者: Taiyan Zhang, Renchi Yang, Yurui Lai, Mingyu Yan, Xiaochun Ye, Dongrui Fan

arXiv:2412.11983v2 通告类型: replace-cross 摘要：图神经网络（GNNs）因其在结合图结构和属性方面强大的能力，已成为图数据节点分类的首选模型。然而，这些模型在训练过程中需要大量的高质量标注数据，获取这些数据往往成本高昂。随着大型语言模型（LLMs）的兴起，利用它们的出色零样本能力和广泛的知识进行节点标注成为一种有前途的方法。尽管取得了令人鼓舞的结果，但这种做法要么需要向LLMs提出大量查询，要么因LLMs生成的嘈杂标签而导致性能下降。为了解决这些挑战，我们提出了Locle，这是一种基于LLMs高效成本的无标签节点分类主动自我训练框架。Locle迭代地识别一小组“关键”样本，并使用LLMs和GNNs为它们提取具有信息性的伪标签，作为额外的监督信号以增强模型训练。具体而言，Locle包括三个关键组件：（i）有效的初始注释主动节点选择策略；（ii）一个谨慎的样本选择方案，基于标签不和谐性和熵来识别“关键”节点；以及（iii）一个标签精炼模块，该模块结合了LLMs、GNNs和重定向的拓扑结构。在五个基准文本属性图数据集上进行的广泛实验表明，在相同的LLMs查询预算下，Locle在无标签节点分类方面显著优于最新方法。值得注意的是，在具有14,300个节点的DBLP数据集上，Locle在不到一分钱的成本下，相对于最新方法提高了8.08%的准确性。我们的代码可在https://github.com/HKBU-LAGAS/Locle获取。

发布时间: 4/29/2025

查看原文

自我一致性嵌套扩散桥加速MRI重构

作者: Tao Song, Yicheng Wu, Minhao Hu, Xiangde Luo, Guoting Luo, Guotai Wang, Yi Guo, Feng Xu, Shaoting Zhang

arXiv:2412.09998v2 宣告类型: replace-cross 摘要: 加速MRI重建在减少扫描时间的同时保持图像质量中发挥着关键作用。尽管大多数现有方法依赖于复值图像域或k空间数据，但由于专有的重建管道，这些格式在临床实践中往往不可用，留下的只有存储在DICOM文件中的幅度图像。为了解决这一差距，我们专注于未充分利用的幅度图像基于的MRI重建任务。最近在扩散模型领域，特别是去噪扩散概率模型（DDPM）的进展，展示了在建模图像先验方面强大的能力。然而，它们任务无关的去噪性质限制了在源到目标图像转换任务中的性能，如MRI重建。在这项工作中，我们提出了一种新颖的自一致嵌套扩散桥（SC-NDB）框架，将加速MRI重建建模为未采样和全采样幅度MRI图像之间双向图像转换过程。SC-NDB引入了嵌套扩散结构，并加入自一致性约束和反桥扩散路径，以提高中间预测的准确性并更好地捕捉源图像的显式先验。此外，我们引入了轮廓分解嵌入模块（CDEM），通过利用拉普拉斯金字塔和方向滤波器组来注入结构和纹理知识。在fastMRI和IXI数据集上的广泛实验表明，我们的方法在幅度基于和非幅度基于的扩散模型中均达到了最先进的性能，证实了SC-NDB的有效性和临床相关性。

发布时间: 4/29/2025

查看原文

激励共生：人类-代理共演进的一种范式

作者: Tomer Jordi Chaffer, Justin Goldston, Gemach D. A. T. A. I

arXiv:2412.06855v4 公告类型: replace-cross 摘要：合作对我们生存和发展至关重要。进化博弈论提供了一种理解促进合作成为成功策略的结构和激励机制的视角。随着人工智能代理成为人类系统的组成部分，合作的动力学变得前所未有的重要。人类-代理团队合作、契约理论和透明性、问责制和信任为基础的去中心化框架（如Web3）相结合，为通过为人类和AI代理建立可执行规则和激励机制来促进合作奠定了基础。我们构想激励共生作为人类与AI之间的社会契约，受到Web3原则的启发并编码在区块链技术中，用于定义和执行双方的规则、激励和后果。通过探索这一范式，我们旨在激发系统思维在AI、Web3和社会交汇处的新研究，促进合作的人-代理共同进化的新途径。

发布时间: 4/29/2025

查看原文

隐藏在噪声之中：两阶段鲁棒水标记技术

作者: Kasra Arabi, Benjamin Feuer, R. Teal Witter, Chinmay Hegde, Niv Cohen

arXiv:2412.04653v5 通知类型: replace-cross 摘要: 随着图像生成器的质量不断提升，深度假象成为社会上广泛关注的话题。图像水印可以让负责任的模型所有者检测和标记其AI生成的内容，从而减轻潜在的危害。然而，当前最先进的图像水印方法仍然容易受到伪造和去除攻击的影响。这种脆弱性部分原因是水印会扭曲生成图像的分布，无意中泄露了水印技术的信息。在本文中，我们首先基于扩散模型的初始噪声提出了一种无损图像水印方法。然而，检测水印需要将图像的初始噪声重建并与所有先前使用的初始噪声进行比较。为了缓解这些问题，我们提出了一种两阶段水印框架以提高检测效率。在生成阶段，我们通过添加生成的傅里叶模式来增强初始噪声以嵌入我们所使用的初始噪声组的信息。在检测阶段，我们(i) 检索相关组的噪声，并(ii) 在给定组中搜索可能会匹配我们图像的初始噪声。这种水印方法在大量攻击下对伪造和去除具有最先进的鲁棒性。

发布时间: 4/29/2025

查看原文

预训练、对齐和解耦：大型语言模型赋能序列推荐

作者: Yuhao Wang, Junwei Pan, Pengyue Jia, Wanyu Wang, Maolin Wang, Zhixiang Feng, Xiaotian Li, Jie Jiang, Xiangyu Zhao

arXiv:2412.04107v2 宣告类型: replace-cross 摘要：序列推荐（SR）旨在利用用户历史交互中的序列模式准确跟踪其偏好。然而，现有SR方法主要依赖协作数据，这导致了冷启动问题和性能不佳等问题。与此同时，尽管大型语言模型（LLMs）的有效性已经得到了证明，它们的商业推荐系统集成受到了高推理延迟、无法完整捕获所有分布统计以及灾难性遗忘等问题的阻碍。为了解决这些问题，我们提出了一种新颖的预训练、对齐和解纠缠（PAD）框架，以增强SR模型的LLMs能力。具体而言，我们首先分别对SR和LLM模型进行预训练，以获得协作和文本嵌入。随后，我们提出了基于特征推荐的对齐损失，使用高斯核的多核最大均值差异。最后，我们采用了一种频率意识的三专家架构，其中包含对齐和模态特定专家以及解纠缠嵌入。在三个公开数据集上的实验结果验证了PAD的有效性，显示了其显著改进以及与各种SR主干模型的兼容性，特别是在冷物品方面。PAD的代码和数据集可在https://github.com/Applied-Machine-Learning-Lab/PAD获取以供复现。

发布时间: 4/29/2025

查看原文