arXiv:2503.22958v1 类别:交叉学科
摘要:布局依赖效应(LDEs)对模拟电路性能产生了显著影响。传统上,设计人员依靠电路元件的对称布局来减轻由LDEs引起的变异性。然而,由于这些效应的非线性性质,传统方法常常难以应对。我们提出了一种基于目标驱动的多层次、多代理Q学习框架,以探索模拟布局的非传统设计空间,从而开辟了优化模拟电路性能的新途径。我们的方法在变异性性能方面优于最先进的布局技术。值得注意的是,这是首次将多代理强化学习应用于模拟布局自动化。我们提出的方法与基于 simulated annealing 的非机器学习方法进行了比较。
arXiv:2503.22954v1 Announce Type: cross
摘要:医疗知识图谱(KGs)对于临床决策支持和生物医学研究至关重要,但由于医学编码系统中的知识空白和结构限制,它们常常表现出不完整性。这个问题在治疗映射中尤为明显,ICD、Mondo和ATC等编码系统缺乏全面的覆盖范围,导致疾病与其潜在治疗方法之间的缺失或不一致关联。为了解决这一问题,我们探索了使用大规模语言模型(LLMs)来填补缺失的治疗关系。尽管LLMs在知识增强方面显示出有希望的能力,但在医学知识填补中的应用存在显著风险,包括事实不准确、虚构的关联以及LLMs之间和内部的不稳定性。在这项研究中,我们系统地评估了LLM驱动的治疗映射,通过基准比较评估其可靠性。我们的发现突显了关键限制,包括与已建立的临床指南不一致以及对患者安全的潜在风险。这项研究为研究人员和实践者提供了一个警示指南,强调了在利用LLMs增强医疗知识图谱中的治疗映射时进行批判性评估和混合方法的重要性。
arXiv:2503.22948v1 声明类型:交叉学科
摘要:大规模语言模型(LLMs)通过从大规模数据集学习已经彻底改变了自然语言处理,然而这种快速进步也引起了法律的关注,因为无意中生成受版权保护内容的能力已经引发了多起重要的诉讼案。在本文中,我们提出了SUV(Selective Unlearning for Verbatim data)选择性遗忘框架,该框架旨在防止LLM记忆受版权保护的内容,同时保持其整体实用性。具体而言,提出的方案构建了一个数据集,该数据集捕捉了目标LLM涉及版权侵权案例的实例。利用这个数据集,我们通过直接偏好优化(DPO)方法从LLM中遗忘内容,该方法用合乎情理且连贯的替代内容替换掉直接抄袭的版权内容。由于DPO可能会影响LLM在其他无关任务的性能,我们整合了梯度投影和费舍尔信息正则化来减轻性能下降。我们使用一个包含500本著名书籍的大规模数据集(主要是受版权保护的作品)验证了我们的方法,并证明了SUV显著减少了直接抄袭的内存化,同时对无关任务的性能几乎没有影响。我们在我们自己的数据集以及公共基准上的广泛实验进一步证实了我们方法的可扩展性和有效性,为应对现实世界LLM应用中的版权风险提供了有前景的解决方案。
arXiv:2503.22946v1 宣告类型:跨领域
摘要:数据驱动的叙事在新闻业和其他数据报道领域中已经变得越来越重要。然而,创建这些叙事的过程仍然充满挑战,通常需要将有效的可视化与引人入胜的叙述相结合,以形成一个连贯的、互动的展示。为了简化这一过程,我们提出了一种集成的创作框架和系统——DataWeaver,它支持可视化到文本和文本到可视化相结合的创作。DataWeaver 允许用户基于来自“突出显示”交互的数据事实(即用户发起的可视化元素高亮,这会促使相关叙述内容的出现)来创建数据叙事。除了这种“可视化到文本”的组合外,DataWeaver 还支持“文本发起”的方法,从现有的叙述中生成相关联的交互式可视化。对13名参与者的评估显示,DataWeaver 具有实用性和易用性,并且其集成的创作框架的有效性。评估还揭示了通过细化过滤机制和可视化推荐以及引入高级自定义选项来进一步增强框架的机会,以更好地支持创意思维的创作。
arXiv:2503.22942v1 宣告类型: cross
摘要:在复杂环境中进行机器人导航仍然是一个关键的研究挑战。传统的导航方法专注于在自由空间内生成最优轨迹,但在缺乏到达目标的有效路径的环境中表现不佳,例如灾难现场或拥挤的仓库中。为了解决这一问题,我们提出了一种适应性的互动导航方法,该方法主动与环境交互以创建通往原本不可达目标的可行路径。具体而言,我们利用大型语言模型(LLMs)为任务规划构建了一个基元树,促进有效的推理以确定交互对象和顺序。为了确保子任务执行的稳健性,我们采用强化学习预先训练了一个全面的技能库,包含多样的运动和交互行为以供运动规划使用。此外,我们引入了一种适应性的重新规划方法,其中包括两个基于LLM的模块:顾问作为灵活的重新规划触发器,以及园艺师进行自主计划调整。结合树结构,重新规划机制允许方便地添加和修剪节点,从而在未知环境中快速修改计划。全面的仿真实验和测试表明,该方法在多种场景中具有有效的适应性。辅助视频可在页面 https://youtu.be/W5ttPnSap2g 获取。
arXiv:2503.22934v1 类型: cross
摘要: 在干净数据上训练的图像分类模型在遇到测试中的受损数据(如含有冲击噪声、高斯噪声或环境噪声的图像)时,往往会遭受显著的性能下降。这种下降不仅影响整体性能,还对各种人口亚群体产生了不公正的影响,从而引发关键的算法偏见问题。尽管像Sharpness-Aware Minimization(SAM)这样的鲁棒学习算法在提高总体模型鲁棒性和泛化能力方面显示出了前景,但它们在解决不同人口亚群体间的不公平性能下降方面仍有不足。现有的公平意识机器学习方法——如公平性约束和加权策略——旨在减少性能差距,但在面对数据损坏时,很难在不同人口亚群体中维持鲁棒且公平的准确性。这揭示了在处理损坏数据时鲁棒性和公平性之间固有的矛盾。为了应对这些挑战,我们引入了一个新的度量标准,专门用于评估在数据损坏情况下不同亚群体的性能下降。此外,我们提出了\textbf{FairSAM},这是一个新的框架,将\textbf{公平}导向的策略融入\textbf{SAM}中,以在受损条件下实现不同人口群体的平等性能表现。我们在多个真实世界数据集和各种预测任务上的实验表明,FairSAM成功地协调了鲁棒性和公平性,为数据损坏环境下提供了结构化的公平和韧性图像分类解决方案。
arXiv:2503.22925v1 安全类型:交叉
摘要:自动驾驶车辆路径规划已达到一个阶段,安全性和法规合规性至关重要。本文提出了一种新的方法,将运动规划器与深度强化学习模型集成,以预测潜在的交通规则违规行为。在此设置中,评判器的预测直接影响运动规划器的成本函数,引导轨迹的选择。我们将在规则书中纳入德国道路交通条例中的关键州际规则,并使用基于图的状态表示来处理复杂的交通信息。我们的主要创新是将演员-评判器设置中的标准演员网络替换为一个运动规划模块,这确保了轨迹生成的可预测性和长期规则违规的防止。在德国开放高速公路数据集上的实验表明,该模型可以在规划 horizon 之外预测和防止交通规则违规,显著提高了在复杂交通条件下的安全性。
arXiv:2503.22909v1 宣告类型: 交叉
摘要: 航空和卫星图像本身是天然互补的遥感来源,提供了高分辨率的细节和广泛的地理覆盖范围。然而,使用这些来源进行土地覆盖分割引入了若干挑战,推动了各种分割方法的发展。在这些方法中,DeepLabV3+ 架构被认为是单源图像分割领域的有前途的方法之一。尽管其在分割方面具有可靠的性能,但仍需要提高其鲁棒性并改进其性能。这对于多模态图像分割尤为重要,因为在多模态图像分割中,不同类型的融合信息是必不可少的。
一种有趣的策略是通过集成新颖组件并修改某些内部过程来增强该架构框架。
在本文中,我们通过引入一种新的转置卷积层块来增强 DeepLabV3+ 架构,该块用于上采样第二个输入并将其与高级特征融合。该块旨在放大并整合卫星图像中的信息,从而通过与航空图像的融合丰富分割过程。
为了进行实验,我们使用了 LandCover.ai(基于航空图像的土地覆盖)数据集中的航空图像,以及来自 Sentinel 2 数据的相应数据集。
通过两者的融合,平均交并比(mIoU)达到了 84.91% 的总 mIoU,而没有使用数据增强。
arXiv:2503.22881v1 Announce Type: cross
摘要:属于精细类别图像之间的差异往往很微妙且高度局部化,现有深度学习模型可解释性技术往往太过模糊,无法提供有用且可解释的解释。我们提出了一种新的可解释性方法(PAIR-X),该方法利用中间模型激活和反向传播的相关性评分来生成精细、高度局部化的成对视觉解释。我们将动物和建筑重新识别(re-ID)作为我们方法的主要案例研究,并在35个公开的re-ID数据集上展示了质上优于一系列可解释性的基线方法的结果。在访谈中,动物re-ID专家一致认为PAIR-X在深度模型解释性方面优于现有的基线方法,并建议其可视化效果可以直接应用于他们的工作中。我们还提出了我们的方法的新型定量评估指标,并展示了PAIR-X的可视化效果,在模型相似度得分相同的情况下,比错误匹配更符合正确的图像匹配。通过提高可解释性,PAIR-X使人类能够更好地区分正确的和错误的匹配。我们的代码可在以下地址获取:https://github.com/pairx-explains/pairx
arXiv:2503.22879v1 交叉类型:宣布
摘要:状态空间模型(SSMs)正逐渐成为与Transformer竞争的强大替代方案,因为它们具有稳定的记忆使用和高性能。然而,由于存储需求和计算能力的限制,将SSMs扩展到云服务或资源有限的设备上仍然是具有挑战性的。为了解决这个问题,使用低位宽数据格式对SSMs进行量化可以减小模型大小并受益于硬件加速。尽管如此,由于SSMs容易受到量化引起的错误的影响,最近的努力集中于在不牺牲性能的情况下优化特定的模型或位宽以提高效率。然而,不同场景需要不同的位宽配置,例如W4A8用于增强大规模批次解码速度,而W4A16则用于增强单用户短提示生成速度。为此,我们提出了Quamba2,适用于Mamba1和Mamba2的W8A8、W4A8和W4A16,以应对在各种平台部署SSMs的需求日益增长的情况。基于状态空间模型(SSMs)保持通道顺序和激活保存的特性,我们提出了一种离线方法,通过排序和聚类对输入x的线性递归来进行8位量化,同时结合针对输入依赖参数B和C的状态组量化。为了确保SSM输出的计算不变性,我们根据聚类序列重新排列权重。实验表明,Quamba2-8B在预填充和生成阶段分别提供了1.3倍和3倍的速度提升,同时将内存减少了4倍,平均准确率下降了1.6%。我们在MMLU上的评估显示了我们框架的一般化能力和鲁棒性。代码和量化模型将在以下链接发布:https://github.com/enyac-group/Quamba。