arXiv:2501.19047v1 类型:交叉
摘要:为了被认为是可靠的,一个模型必须校准,使其在每个决策中的置信度密切反映其真实结果。在本文中,我们将探讨最常用的那种校准定义,然后深入讨论一种常用模型校准评估度量。随后,我们将涵盖这种度量的一些缺点,这些缺点表明了需要额外的校准概念的必要性,这些概念需要其自己的新评估度量。本文无意对所有校准作品进行深入剖析,也不专注于如何校准模型。相反,本文旨在提供不同概念及其评估度量的温和介绍,同时重申一个仍广泛用于评估校准的度量措施中的一些问题。
arXiv:2501.19042v1 宣告类型: cross
摘要: 机器人群体中的协调行为本质上是多模态的。即,一堆机器人可以通过多种方式避免个体间的碰撞并达到各自的目标。然而,以可扩展的方式生成多样且可行的群体行为问题仍然很大程度上未得到解决。在本文中,我们通过结合生成模型与安全滤波器(SF)来填补这一空白。具体来说,我们从学习到的生成模型中采样多样化的轨迹,随后使用SF将这些轨迹投影到可行集上。我们尝试了两种生成模型的选择,即条件变分自编码器(CVAE)和向量量化的变分自编码器(VQ-VAE)。我们强调这两种模型在计算时间和轨迹多样性上的权衡。我们为我们的SF开发了一个自定义求解器,并配备了用于预测上下文特定初始化的神经网络。初始化网络以半监督方式训练,利用SF求解器的可微性。我们提供了两组实验结果。首先,我们演示了在数百毫秒内可以生成大量多模态、可行的轨迹,模拟多样化的群体行为。其次,我们展示了我们的初始化网络在相对于其他替代启发式方法方面,使我们的SF求解器更快地收敛。
arXiv:2501.19003v1 Announce Type: cross
摘要:目的:我们提出了一种虚拟模型,旨在优化肺活检规划系统中的进入点(POE)。该模型能够计算从潜在POE获取活检样本的质量,同时考虑到规划模拟中的方向与实际操作中的方向之间的差异所引起的方向误差的幅度。此外,研究还考察了病灶特性的影响。方法:活检质量通过投影到患者特定气道模型的骨骼上的热图来表示。骨骼提供气道结构的3D表示,而热图强度则表示可以从每个POE提取的潜在组织量。这种组织量由病灶与一个代表穿刺不准确性区域的圆锥体的交集来确定。圆锥体、病灶和骨骼被建模为图形对象,定义了介入操作的3D场景。结果:我们从一份CT扫描提取的单个解剖结构中模拟了不同设置的介入场景,并对两个具有规则形状和不规则形状的病灶进行了模拟。通过系统旋转每个病灶并将其置于不同的距离上,模拟了不同的场景。对不同设置的热图分析显示,对于不规则形状的病灶,方向有很大影响;而对于两种形状的病灶,距离也产生了很大影响。结论:所提出的热图有助于视觉评估最优POE,并识别在支气管的不同区域是否存在多个最优POE。它们还允许我们模型化导航系统的最大允许误差,并研究哪些变量对操作的成功影响最大。此外,它们有助于确定在这个影响可能潜在地危及操作时的具体点。
arXiv:2501.18998v1 类别:交叉学科
摘要:近年来,利用人工智能(AI)的文本生成工具在各个领域偶尔被误用,例如生成学生报告或创造性写作。这一问题促使了剽窃检测服务提升其识别AI生成内容的能力。通常使用对抗性攻击来测试AI文本检测器的鲁棒性。本工作提出了一种针对检测模型(如Fast-DetectGPT)的新型文本对抗攻击方法。该方法利用嵌入模型进行数据扰动,旨在重构AI生成的文本以降低检测其真实来源的可能性。具体来说,我们采用了不同的嵌入技术,包括解释性机器学习中的Tsetlin机(TM),以实现这一目的。通过结合同义词和嵌入相似向量,我们展示了相比于Fast-DetectGPT,最先进的检测分数降低。特别地,在XSum数据集中,检测分数从0.4431降至0.2744 AUROC,而在SQuAD数据集中,则从0.5068降至0.3532 AUROC。
arXiv:2501.18994v1 宣告类型: cross
摘要: 本文通过提出 VKFPos,一种将绝对位姿回归 (APR) 和相对位姿回归 (RPR) 结合到扩展卡尔曼滤波 (EKF) 中的新方法,以变分贝叶斯推断框架解决基于学习的单目定位的挑战。我们的方法表明,单目定位问题的基本后验概率可以分解为 APR 和 RPR 组件。这种分解通过预测 APR 和 RPR 支路中的协方差嵌入到深度学习模型中,使其能够考虑相关不确定性。这些协方差增强了损失函数并促进 EKF 的集成。在室内和室外数据集上的实验评估表明,单次 APR 支路的精度与最先进的方法相当。此外,对于连续图像允许 RPR 和 EKF 集成的时间定位,VKFPos 的性能优于时间 APR 和基于模型的集成方法,实现了更高的准确性。
arXiv:2501.18980v1 宣告类型: cross
摘要: Wanda和RIA等流行的后训练裁剪方法因其简单而有效的设计而闻名,这些设计在实验上表现出色。Wanda通过修剪期间校准的激活来优化性能,而RIA强调权重元素的相对重要性,而非绝对重要性。尽管这些方法在实际应用中表现出色,但缺乏一个全面的理论基础来解释这些结果。本文引入了新的理论见解,重新定义了裁剪的标准最小化目标,提供了对其成功因素的更深入理解。我们的研究在此基础上进一步提出了一种互补策略,同时考虑输入激活和权重的重要性。我们通过严格的实验验证了这些方法,展示了相对于现有方法的巨大改进。此外,我们引入了一种新的无训练微调方法 $R^2$-DSnoT,该方法在动态裁剪和生长框架中结合了相对权重重要性和规范化决策边界,显著优于强基线,并建立了新的性能基准。
arXiv:2501.18973v1 Announce Type: cross
摘要:动机:预测遗传扰动对细胞的响应对于理解生物系统和开发靶向治疗策略至关重要。虽然变分自编码器(VAEs)在建模扰动响应方面显示出前景,但它们有限的可解释性构成了一个显著的挑战,因为学习到的特征往往缺乏明确的生物学意义。然而,在生物人工智能领域,模型的可解释性是最重要的方面之一。实现可解释性的最有效方法之一是在设计如VAEs等深度学习模型时结合基因调控网络(GRNs)的概念。GRNs能够揭示基因之间的潜在因果关系,并能够解释由遗传扰动治疗引起的转录响应。结果:我们提出了GPO-VAE,这是一种通过GRN对齐参数优化增强的可解释VAE,它在潜空间中明确建模基因调控网络。我们提出的关键方法是优化与潜空间扰动效应相关的可学习参数,使其朝向GRN对齐的可解释性。在扰动预测的实验结果中,我们的模型在多个基准数据集上预测转录响应方面达到了最先进的性能。此外,对GRN推理任务的额外评估结果表明,与其它方法相比,我们的模型能够生成有意义的GRNs。根据定性分析,GPO-VAE具备构建与实验验证的调控路径相一致的生物可解释GRNs的能力。GPO-VAE可在https://github.com/dmis-lab/GPO-VAE获取。
arXiv:2501.18959v1 交叉类型:公告
摘要:XNet 是一种单层神经网络架构,利用柯西积分为基础的激活函数进行高阶函数近似。通过理论分析,我们表明 XNet 中使用的柯西激活函数可以实现任意阶多项式收敛,本质上优于传统的多层感知机(MLPs)和依赖于增加深度或 B-样条激活函数的柯尔莫哥洛夫-阿诺尔德网络(KANs)。在函数近似、偏微分方程求解和强化学习方面的广泛实验表明,XNet 的性能更优 - 在函数近似错误上最多可以减少 50000 倍,并且训练速度最多可以加快 10 倍,与现有方法相比。这些结果使 XNet 成为科学计算和人工智能应用中一种高效的架构。
arXiv:2501.18955v1 交叉类型:cross
摘要:本文探讨了一种基于深度学习的机器人智能模型,使机器人能够学习和推理复杂任务。首先,通过构建环境因素矩阵网络来模拟机器人智能模型的学习过程,模型参数必须经过粗调和细调来优化损失函数,以最小化损失分数。同时,机器人智能模型可以将所有已知概念融为一体,以表示从未经历过的事物,这需要机器人智能模型具备广泛的泛化能力。其次,为了逐步培养具有初步意识的机器人智能模型,每台机器人必须接受至少1至3年的特殊学校训练,以理解并处理复杂环境信息,并做出合理的决策。本文探讨并展示了基于深度学习的准意识训练在机器人智能模型领域的潜在应用。
arXiv:2501.18950v1 类型: cross
摘要:概念擦除作为一种有希望的技术,通过有选择地遗忘不期望的概念来减轻扩散模型生成有害内容的风险。以往工作的共同原则是将特定概念映射到一个固定的通用概念,例如中性概念或只是一个空的文字提示。在本文中,我们证明了这种固定目标策略是次优的,因为它未能考虑擦除一个概念对其他概念的影响。为了解决这一局限性,我们将概念空间建模为一个图,并实证分析了擦除一个概念对剩余概念的影响。我们的分析揭示了概念空间的一些引人注目的几何特性,其中擦除一个概念的影响局限于一个局部区域。基于这一洞察,我们提出了自适应引导擦除(AGE)方法,该方法针对每个不期望的概念动态选择最优的目标概念,从而最小化无意的副作用。实验结果显示,在保留无关概念的同时,AGE 在擦除性能方面明显优于现有的最先进的擦除方法。我们的代码发布在 {https://github.com/tuananhbui89/Adaptive-Guided-Erasure}。