arXiv:2505.09646v1 类别: cross
摘要:本文提出了一种新的理论模型,旨在通过减少感知延迟来解释人类思维和人工智能如何接近实时意识。通过研究宇宙信号延迟、神经反应时间和古代静谧的认知状态,我们探讨了如何从反应性感知转变为与近未来的自觉接口。本文介绍了两种感知当前的方法模型,即不将其视为线性的时间戳,而是将其视为一种干扰区,在这里早期到达的宇宙信号与人类的反应延迟交汇。我们提出了使用人类神经观察和神经感知延伸进行实验的方法来测试这些想法。最后,我们提出了一种数学框架,以指导人工智能系统的进化,使之朝着时间效率高、伦理上可靠且具备内在意识的决策过程方向发展。
arXiv:2505.09624v1 类型: cross
摘要:自适应深脑刺激(aDBS)已成为治疗帕金森病(PD)的一种有前途的治疗方法。在aDBS中,通过外科植入的电极根据神经生理反馈发送动态变化的刺激:一种侵入性设备,限制了可以收集的数据量,进而优化控制。因此,提出了许多PD的合成模型以及控制算法模型。在此,我们首次介绍了用于比较这些模型的神经生理学现实基准。具体来说,我们的方法不仅涵盖了传统的基底核电路动力学和病理性振荡,而且还捕捉到了15种之前被忽略的生理属性,如信号不稳定性和噪声、神经漂移、电极电导变化和个体差异——这些属性通过大脑中的贝塔带活动和反馈,作为空间分布和时间对齐的特征进行建模。此外,我们特意将该框架构建为用于训练和评估深度强化学习(RL)算法的结构化环境,为优化aDBS控制策略开辟了新的可能性,并邀请机器学习社区为新兴的智能神经刺激接口领域做出贡献。
arXiv:2505.09619v1 交叉类型: cross
摘要:在当今的医疗保健中,慢性心力衰竭(HF)的管理面临着重大挑战,需要持续监测、早期检测恶化和个性化的治疗策略。在本文中,我们提出了一种基于机器学习(ML)技术的预测模型,以识别HF患者。该模型是一种集成学习方法,一种修改的堆叠技术,利用两种专门模型利用临床和超声心动图特征,然后通过一个元模型来结合这两大模型的预测结果。我们最初在真实数据集上评估了该模型,获得的结果表明,它在HF风险患者的风险分层中表现良好。具体来说,我们获得了95%的高灵敏度,确保几乎所有高风险患者都能被识别。至于准确性,我们获得了84%,在一些机器学习(ML)背景下可以被认为是中等水平的。但是,考虑到我们优先识别HF风险患者的目标,因为在某些作者正在进行的PrediHealth研究项目中,他们将被要求参与HF远程监测项目,这个准确性是可以接受的。初步的研究结果还表明,基于机器学习(ML)的风险分层模型不仅能为PrediHealth项目,还能为医疗专业人员提供有价值的决策支持工具,有助于早期干预和个性化患者管理。为了更好地了解我们预测模型的价值和潜力,我们还将其结果与使用三个基线模型获得的结果进行了对比。初步结果表明,我们的预测模型优于这些仅考虑特征而不将其分组为临床和超声心动图特征的基线模型。
arXiv:2505.09616v1 通知类型: 交叉
摘要:本文提出了一种名为SpecWav-Attack的对抗模型,用于检测匿名语音中的说话人。该模型利用Wav2Vec2进行特征提取,并结合频谱图缩放和增量训练以提高性能。SpecWav-Attack在librispeech-dev和librispeech-test上的评估中优于传统攻击方法,揭示了匿名语音系统中的漏洞,并强调了需要更强的防御措施,这些防御措施是根据ICASSP 2025攻击挑战进行基准测试的。
arXiv:2505.09593v1 宣告类型: cross
摘要:异常检测领域的文献中充满了离线方法,这些方法需要反复访问内存中的数据,并在应用于流式环境时强加不切实际的假设。现有的在线异常检测方法通常也未能解决这些限制,因此不得不周期性地重新训练以适应在线环境。我们提出了 Online-iForest,这是一种明确针对流式条件设计的新方法,可以无缝跟踪数据生成过程,随着其随时间演变而演变。在实际数据集上的实验验证表明,Online-iForest 在性能上与在线替代方法相当,并且在需要周期性重新训练的先进离线异常检测技术中表现得非常接近。值得注意的是,Online-iForest 在效率方面始终优于所有竞争对手,使其在需要快速识别异常的应用场景(如网络安全、欺诈和故障检测)中具有前景。
arXiv:2505.08202v1 宣告类型: cross
摘要:自然灾害,包括地震、野火和台风,对人类生命以及基础设施资产构成了巨大的风险。有效的灾害应对依赖于快速高效地评估损害程度的能力。人工智能(AI)和生成型人工智能(GenAI)提供了突破性的解决方案,能够结合多种数据源的知识,模拟灾难的真实场景,并以以前无法想象的速度识别新兴趋势。在本文中,我们对AI和GenAI在各种自然灾害损害评估中的前景进行了全面回顾,强调了其优点和局限性。我们讨论了其在多模态数据(如文本、图像、视频和音频)中的应用,并涵盖了危机期间数据隐私、安全和技术伦理使用的主要问题。本文还承认生成型AI滥用的威胁,包括错误信息的传播和对抗性攻击等形式。最后,我们提出了未来研究的途径,强调了在灾害管理中需要安全、可靠并符合伦理的生成型AI系统。我们认为,这项工作代表了关于生成AI技术在灾害评估和应对领域首次进行的全面调查。
arXiv:2505.03084v1 安全公告类型: 交叉
摘要: 多模态模型的引入是人工智能的一大进步。一个单一的模型被训练来理解多种模态:文本、图像、视频和音频。开源多模态模型使这些突破更具可访问性。然而,考虑到这些模态之间广泛的对抗性攻击,这些模型也继承了所有模态的脆弱性,并最终使对抗性威胁加剧。尽管在这些模态内部或之间可能存在攻击的广泛研究中,能够为从业者概述攻击类型的观点在多模态世界中仍然缺席。随着更多的机器学习从业者采用、微调并在实际应用中部署开源模型,他们能够了解威胁场景并采取必要的预防措施至关重要。本文通过调查针对所有四种模态的对抗性攻击(文本、图像、视频和音频)弥补了这一差距。该调查提供了对抗性攻击场景的视角,并展示了多模态对抗性威胁如何演变。据我们所知,这是第一次全面总结多模态世界中威胁场景的调查。
arXiv:2410.13778v1 类别: cross
摘要: 我们提出了Kernel-QuantTree Exponentially Weighted Moving Average (KQT-EWMA)算法,这是一种结合了Kernel-QuantTree (KQT)直方图和指数加权移动平均(EWMA)统计量的非参数变化检测算法,用于在线监控多变量数据流。该监控方案非常灵活,因为直方图可以用于模拟任何平稳分布,而且实际可行,因为在平稳条件下,测试统计量的分布与数据流的分布无关(非参数监控)。KQT-EWMA 通过在其预定的平均运行长度 ($ARL_0$)下运行来控制误报,$ARL_0$ 衡量在触发误报之前需要监测的平稳样本平均数量。后者的特点与大多数非参数变化检测测试不同,这些测试很少能够在事前控制 $ARL_0$。我们在合成和真实世界数据集上的实验表明,KQT-EWMA 可以在达到或接近与设计用于相同条件下的最先进的方法相当的检测延迟的同时控制 $ARL_0$。
arXiv:2306.07615v5 声称类型:交叉学科
摘要:单步医疗标志检测因其高效的标注训练过程受到了广泛关注并取得了巨大成功。然而,现有的单步学习方法在单域中特别专一,并且在多域无标注数据的情况下严重依赖特定领域。此外,单步学习方法不够稳健,当对图像进行标注时会面临性能下降的问题。为了解决这些问题,我们开发了一个适用于多域医疗图像的单步地标检测框架,名为Universal One-shot Detection (UOD)。UOD由两个阶段和两个相应的通用模型组成,这些模型设计为域特定模块和域共享模块的组合。在第一阶段,一个域适应卷积模型在自监督下学习以生成伪地标标签。在第二阶段,我们设计了一个域适应变换器来消除领域偏好并为多域数据构建全局上下文。即使每个领域只能获得一个标注样本用于训练,域共享模块帮助UOD整合所有单步样本以检测更稳健和准确的地标。我们对提出的UOD在三个广泛应用的公共X光数据集(即头部、手部、胸部)的不同解剖域进行了定性和定量的研究,并在每个域中取得了最先进的性能。代码可在https://github.com/heqin-zhu/UOD_universal_oneshot_detection获取。
arXiv:2505.10543v1 宣布类型: 新颖
摘要: 尽管大型语言模型在静态基准测试中表现出色,但大型语言模型作为自学习和推理代理在动态环境中的真实潜力仍不清楚。本研究系统评估了自省、启发式变异和规划作为提示技术的有效性,以测试代理的适应能力。我们使用各种开源语言模型在动态环境中进行实验,发现通常较大的模型优于较小的模型,但战略性提示可以缩小这一性能差距。其次,过长的提示对较小模型的基本反应任务有负面影响,而较大的模型表现出更加稳健的行为。第三,高级提示技术主要对复杂游戏中的较小模型有益,但对于已经表现优异的大型语言模型的改进较少。然而,我们发现高级推理方法会导致结果高度不稳定:在推理和决策一致时,这些方法可以显著提高性能,但也可能引入不稳定性和导致性能大幅下降。与人类性能相比,我们的研究结果几乎没有证据表明真正新兴的推理能力。相反,大型语言模型在计划、推理和空间协调等领域显示出持续的局限性,表明当前的大型语言模型仍存在根本性的不足,这些不足可能无法仅通过自我反省提示完全克服。推理是一个多方面的任务,尽管像思维链这样的推理方法在数学文字问题的多步推理中有所改进,但我们的研究使用动态基准测试突出了一般推理能力中的重要不足,表明需要超越静态基准测试以捕捉推理的复杂性。