arXiv 论文列表

作者: Christos Margadji, Andi Kuswoyo, Sebastian W. Pattinson

arXiv:2502.01517v1 宣布类型: cross 摘要：能够准确地生成具有指定属性的几何形状可能是制造过程最重要的特征之一。3D打印具有卓越的设计自由度和复杂性，但也容易出现几何和其他缺陷，这些缺陷必须得到解决，以充分发挥其潜力。最终，这将需要明智的设计决策和及时的参数调整来维持稳定性，这即使在拥有专家操作员的情况下也具有挑战性。尽管机器学习在3D打印中得到了广泛研究，但现有方法通常忽略了在不同打印中变化的空间特征，因此难以生成所需的几何形状。在这里，我们将打印部件的体素表示编码到神经场中，并应用一种新的正则化策略，该策略基于最小化字段输出对单一不可学习参数的偏导数。通过鼓励小的输入变化仅导致小的输出变化，我们鼓励在观察到的体积之间平滑插值，从而实现现实几何预测。因此，该框架允许提取“想象中的”3D形状，揭示在未见过的参数下制造部件的外观。由此得到的连续场用于数据驱动的优化，以最大化期望几何和生成几何之间的几何保真度，减少后处理、材料浪费和生产成本。通过动态优化工艺参数，我们的方法使先进的规划策略成为可能，这可能使制造商更好地实现复杂和功能丰富的设计。

发布时间: 2/4/2025

查看原文

MoireDB：公式生成的干涉条纹图像数据集

作者: Yuto Matsuo, Ryo Hayamizu, Hirokatsu Kataoka, Akio Nakamura

arXiv:2502.01490v1 类型: cross 摘要：图像识别模型在处理实际环境中的退化 robustness 方面一直难以应对。在这种背景下，数据增强方法如 PixMix 能够提高 robustness，但这些方法依赖于生成艺术和特征可视化 (FVis)，存在版权问题、绘画成本以及扩展性问题。我们提出了 MoireDB，这是一个由公式生成的交错纹图像数据集，用于图像增强以提高 robustness。MoireDB 消除了版权问题，降低了数据集组装成本，并通过利用虚幻模式增强了 robustness。实验结果显示，MoireDB 增强的图像在传统分形艺术和基于 FVis 的增强之上表现出色，使其成为一个能够提高模型对实际环境退化 robustness 的可扩展且有效的解决方案。

发布时间: 2/4/2025

查看原文

Position: 用多模态大语言模型赋能时间序列推理

作者: Yaxuan Kong, Yiyuan Yang, Shiyu Wang, Chenghao Liu, Yuxuan Liang, Ming Jin, Stefan Zohren, Dan Pei, Yan Liu, Qingsong Wen

arXiv:2502.01477v1 类别: cross 摘要：理解时间序列数据对于多个实际应用至关重要。尽管大型语言模型（LLMs）在时间序列任务中显示出潜力，但当前的方法往往仅依赖于数值数据，忽略了时间依赖信息的多模态性质，如文本描述、视觉数据和音频信号。此外，这些方法未能充分利用LLMs的推理能力，限制了对表面层面的解释而非更深层次的时间和多模态推理。在这份立场文件中，我们主张多模态LLMs（MLLMs）能够为时间序列分析提供更强大和灵活的推理能力，从而增强决策制定和实际应用。我们呼吁研究者和从业者通过制定重视信任、可解释性和稳健推理的策略来利用这一潜力。最后，我们强调了关键的研究方向，包括新的推理范式、架构创新和特定领域的应用，以促进使用MLLMs的时间序列推理发展。

发布时间: 2/4/2025

查看原文

FALCON：通过对比正交未对齐进行细粒度激活操纵的大语言模型

作者: Jinwei Hu, Zhenglin Huang, Xiangyu Yin, Wenjie Ruan, Guangliang Cheng, Yi Dong, Xiaowei Huang

arXiv:2502.01472v1 类型: cross 摘要: 大型语言模型已被广泛应用，但可能会无意中编码敏感或有害信息，从而引发重大安全问题。机器遗忘技术已出现以缓解这一问题；然而，现有的基于粗粒度损失组合的训练时遗忘方法在精确分离知识和在遗忘效果与模型实用性之间取得平衡方面存在局限性。与此相反，我们提出了FALCON（Fine-grained Activation manipuLation by Contrastive Orthogonal uNalignment），这是一种新颖的基于表示的遗忘方法，利用信息论指导进行高效的参数选择，在增加表示分离的同时采用对比机制，并将冲突梯度投影到正交子空间以解决遗忘和保留目标之间的冲突。广泛的实验表明，FALCON在保持模型实用性的同时实现了优越的遗忘效果，展现出对知识恢复尝试的稳健抗性。

发布时间: 2/4/2025

查看原文

通过隐式奖励强化过程

作者: Ganqu Cui, Lifan Yuan, Zefan Wang, Hanbin Wang, Wendi Li, Bingxiang He, Yuchen Fan, Tianyu Yu, Qixin Xu, Weize Chen, Jiarui Yuan, Huayu Chen, Kaiyan Zhang, Xingtai Lv, Shuo Wang, Yuan Yao, Xu Han, Hao Peng, Yu Cheng, Zhiyuan Liu, Maosong Sun, Bowen Zhou, Ning Ding

arXiv:2502.01456v1 交叉类型摘要：在大型语言模型（LLMs）的推理时扩展中，密集过程奖励已被证明是稀疏结果级奖励更加有效的替代方案，尤其是在需要复杂多步推理的任务中。尽管密集奖励也为LLMs的强化学习（RL）提供了一种有吸引力的选择，因为它们的细微奖励有可能解决结果奖励的一些内在问题，如训练效率和责任分配问题，但这种潜力尚未得到充分利用。这主要归因于在线训练过程奖励模型（PRMs）的挑战，其中收集高质量的过程标签成本高昂，使它们特别容易受到奖励劫持的影响。为了应对这些挑战，我们提出了PRIME（过程通过隐含奖励的强化学习），它仅通过隐含过程奖励使用策略滚动和结果标签实现了在线PRM更新。PRIME能够与各种优势函数很好地结合，并放弃了现有方法所需的专门奖励模型训练阶段，显著减少了开发工作量。我们通过竞技数学和编程示范了PRIME的有效性。从Qwen2.5-Math-7B-Base开始，PRIME在几个关键推理基准上的平均改进为SFT模型的15.1%。值得注意的是，我们最终的模型Eurus-2-7B-PRIME仅使用其训练数据的10%，就在七个推理基准上超过了Qwen2.5-Math-7B-Instruct。

发布时间: 2/4/2025

查看原文

时间一致的CAMs在垃圾分类中的弱监督视频分割中应用

作者: Andrea Marelli, Luca Magri, Federica Arrigoni, Giacomo Boracchi

arXiv:2502.01455v1 类别：交叉学科摘要：在工业场景中，弱监督（WS）方法通常比其完全监督（FS）的同类方法更受欢迎，因为它们不需要昂贵的手动标注。不幸的是，WS模式下获得的分割掩码通常在准确性上差强人意。在本文中，我们提出了一种WS方法，能够在视频流的情况下产生准确的掩码用于语义分割。更具体地，我们构建了显著性图，利用视频中连续帧之间的时序一致性，促进对象在不同帧间的一致性出现。我们将在废物分拣场景中应用该方法，通过训练一个辅助分类器来区分人类操作员在传送带上手动移除特定废物前后录制的视频。该分类器的显著性图标识需要移除的材料，并且我们在对象位移补偿后，修改分类器的训练，以最小化中心帧和其他相邻帧显著性图之间的差异。在实际数据集上的实验表明，在分类器的训练阶段直接集成时序一致性可以带来好处。代码和数据集可根据请求获得。

发布时间: 2/4/2025

查看原文

使用大语言模型代理模拟社交网络中的谣言传播

作者: Tianrui Hu, Dimitrios Liakopoulos, Xiwen Wei, Radu Marculescu, Neeraja J. Yadwadkar

arXiv:2502.01450v1 宣传类型：交叉摘要：随着社交媒体的兴起，虚假信息日益泛滥，很大程度上是由于谣言的传播。本研究探索了在新颖框架中使用大语言模型（LLM）代理以模拟和分析谣言在社交网络中的传播动态。为此，我们设计了多种基于LLM的代理类型，并构建了四种不同的网络结构来进行这些模拟。我们的框架评估了不同网络结构和代理行为对谣言传播效果的影响。研究结果表明，该框架可以模拟在各种具有数千条边的网络中超过一百个代理之间的谣言传播。评估结果显示，网络结构、角色和传播方案可以显著影响谣言的传播，从完全不传播到影响83%的代理，在迭代过程中，因此提供了一个现实的社交网络中谣言传播的模拟。

发布时间: 2/4/2025

查看原文

SPFFNet：条纹感知和特征融合的空间金字塔池化在织物缺陷检测中的应用

作者: Peizhe Zhao

arXiv:2502.01445v1 交叉类型: cross 摘要：织物缺陷检测对于质量控制至关重要，但现有的方法往往难以应对复杂的背景和形状特定的缺陷。本文提出一种基于YOLOv4的改进型织物缺陷检测模型。为增强对于条状缺陷的检测，我们引入了一种条状感知模块（Strip Perception Module, SPM），通过多尺度卷积提高特征捕捉能力。为进一步增强空间金字塔池化快速版（SPPF），我们整合了挤压与激励机制，形成了SE-SPPF模块，更好地结合了空间和通道信息，以实现更有效的缺陷特征提取。此外，我们提出了一种新颖的自适应权重强化完整交并比（Focal Enhanced Complete Intersection over Union, FECIoU）度量，通过调整焦损失的权重来解决比例差异和类别不平衡的问题。实验结果表明，我们的模型在天池数据集上的均值平均精度（mAP）提高了0.8-8.1%，在我们的自定义数据集上的改进幅度为1.6-13.2%，超过了现有的其他先进方法。

发布时间: 2/4/2025

查看原文

向着更安全的聊天机器人：自定义GPT合规性评估框架

作者: David Rodriguez, William Seymour, Jose M. Del Alamo, Jose Such

arXiv:2502.01436v1 类别: cross 摘要：大型语言模型（LLMs）获得了前所未有的重要性，已经在多个领域得到广泛应用，并深深融入了社会。将通用的大语言模型，如生成预训练变换器（GPT），进行特定任务的微调，促进了各种定制GPT的出现。这些定制模型越来越多地通过专门的市场平台提供，如OpenAI的GPT商店。然而，它们的黑箱性质引入了重大安全和合规风险。在这项工作中，我们提出了一种可扩展的框架，用于自动评估定制GPTs是否符合OpenAI的使用政策，这些政策界定了这些系统的可接受行为。该框架集成了三个核心组件：（1）自动发现和从GPT商店收集模型数据，（2）针对特定政策类别和每个目标GPT的特点定制的红队触发器生成器，以及（3）LLM作为裁判的技术，用于分析每个触发器-响应对，以发现潜在的政策违规行为。我们使用手动标注的真实数据来验证该框架，并通过一项大规模研究进行了评估，该研究涉及来自三个类别（浪漫、网络安全和学术GPTs）的782个定制GPTs。我们的手动标注过程在识别政策违规方面的F1分数为0.975，确认了该框架评估的可靠性。研究结果表明，58.7%的分析模型表现出非合规的迹象，揭示了GPT商店审查和批准流程中的弱点。此外，我们的研究显示，模型的流行程度并不与合规性相关，而不合规问题大多源自基模型行为，而不是用户驱动的自定义。我们相信，这种方法可以扩展到其他聊天机器人平台和政策领域，提高基于LLM的系统的安全性。

发布时间: 2/4/2025

查看原文

飞虫嗅觉回路的结构特征缓解了持续学习中的稳定-可塑性困境

作者: Heming Zou, Yunliang Zang, Xiangyang Ji

arXiv:2502.01427v1 宣告类型: cross 摘要: 在连续学习中，人工神经网络面临稳定性和可塑性的困境，而大脑能够保持记忆并保持适应性。然而，生物连续学习的策略及其对神经网络学习算法的潜在启发作用仍不完全理解。本研究介绍了一种苍蝇嗅觉回路的最小模型，以探讨支持连续气味学习的生物策略。我们引入苍蝇嗅觉回路作为可插拔组件，称为苍蝇模型，它可以与现代机器学习方法集成，以解决这一困境。我们的研究结果表明，苍蝇模型能够同时增强记忆稳定性和学习可塑性，超越了现有连续学习策略的局限性。我们使用常用的数据集在各种具有挑战性的连续学习场景中验证了其有效性。苍蝇嗅觉系统作为终身学习的优雅生物回路，提供了一个在最小额外计算成本下增强连续学习的模块，适用于机器学习。

发布时间: 2/4/2025

查看原文