LLM2D

arXiv 论文列表

arXiv:2504.16142v1 声明类型: cross 摘要:近年来,基于单表数据实现设备级能源消耗准确分解的独特优势,使非侵入式负载监测(NILM)技术在相关研究领域引起了广泛关注。基于机器学习和深度学习的前沿方法通过时频域特征的融合,在负载分解准确性方面取得了显著成果。然而,这些方法通常面临高计算成本和巨大的内存需求,成为其部署在资源受限的微控制器单元(MCUs)上的主要障碍。为应对这些挑战,本研究提出了时频域中的创新动态时间规整(DTW)算法,并系统比较和分析了六种机器学习技术在家庭电力环境中的性能。通过在边缘MCUs上的完整实验验证,该方案成功实现了95%的识别准确率。同时,本研究深入优化了频域特征提取过程,有效减少了运行时间55.55%和存储开销约34.6%。算法性能将在未来的研究工作中进一步优化。考虑到电压互感器设计的消除可以显著降低成本,后续研究将重点在此方向上,并致力于为NILM的实际应用提供更经济有效的解决方案,在边缘计算环境中设计高效NILM系统提供坚实理论基础和可行的技术路径。
发布时间: 4/24/2025
查看原文
arXiv:2504.16140v1 Announce Type: 跨领域 摘要:联合嵌入预测架构(JEPA)已成为学习通用表示的强大框架。然而,这些模型往往缺乏可解释性,并且由于密集嵌入表示而导致效率低下。我们提出了SparseJEPA,这是一种将稀疏表示学习整合到JEPA框架中的扩展,以增强学习到的表示的质量。SparseJEPA 使用一种惩罚方法,该方法鼓励潜在空间变量在具有强烈语义关系的数据特征之间共享,同时保持预测性能。通过在CIFAR-100数据集上进行训练以及预训练轻量级的Vision Transformer,我们展示了SparseJEPA的有效性。改进后的嵌入在图像分类和低级任务的线性探测迁移学习中被利用,展示了该架构在不同迁移任务中的灵活性。此外,我们提供了一个理论证明,证明了分组机制能够提高表示质量。这包括证明分组减少了潜在变量之间的多信息量,并通过证明多信息量的数据处理不等式来进行这一证明。我们的结果显示,引入稀疏性不仅细化了潜在空间,还促进了学习到更具有意义和可解释的表示。在进一步的工作中,我们希望通过基于对象的表示学习来探索利用分组机制的新方法。
发布时间: 4/24/2025
查看原文
arXiv:2504.16139v1 宣告类型:交叉 摘要:随着人工智能(AI)重塑各行各业和社会,确保其可信度——通过减轻偏见、不透明性和问责制缺陷等伦理风险——仍然是一个全球性的挑战。国际标准化组织(ISO)的AI标准,如ISO/IEC 24027和24368,旨在通过将公平性、透明性和风险管理融入AI系统来促进负责任的发展。然而,这些标准在不同监管环境下的有效性各异,从欧盟的风险基于AI法到中国的以稳定性为重点的措施以及美国分散的州主导倡议。本文介绍了一种新的比较风险影响评估框架,以评估ISO标准在这些背景下如何有效地应对伦理风险,并提出了增强其全球适用性的改进建议。通过将ISO标准与欧盟AI法案对接,并对包括英国、加拿大、印度、日本、新加坡、韩国和巴西在内的十个地区的监管框架进行调查,我们建立了一个伦理对齐的基准。该框架应用于欧盟、美国科罗拉多州和中国案例研究中,揭示了现有缺口:自愿性ISO标准在执行方面存在不足(如科罗拉多州),并且低估了特定区域性的风险,例如隐私(中国)。我们建议实施强制性风险审查、特定地区的附录以及隐私导向模块,以增强ISO的适应性。这一方法不仅综合了全球趋势,还提供了一种可供他人复制的工具,用于使标准化符合伦理要求,促进AI的互操作性和全球信任。决策者和标准机构可以利用这些洞见来完善AI治理,确保技术发展满足多样化社会需求。
发布时间: 4/24/2025
查看原文
arXiv:2504.16138v1 宣告类型: cross 摘要:政府开始要求基于训练AI模型所使用的计算量对AI模型进行规范。例如,欧盟AI法案对存在系统性风险的一般用途AI提供了规范,其中包括使用超过 $10^{25}$ 浮点操作(FLOP)进行训练的系统。在美国的AI扩散框架中,使用 $10^{26}$ FLOP 作为训练计算阈值来识别“管控模型”,这些模型需要面对一系列要求。我们探讨了这些训练计算阈值在未来会捕捉到多少模型。我们估计到2028年底,将有103-306个基础模型超过欧盟AI法案提出的 $10^{25}$ FLOP 阈值(90% 置信区间),45-148个模型超过美国AI扩散框架中定义的“管控模型”的 $10^{26}$ FLOP 阈值(90% 置信区间)。我们还发现,每年超过这些绝对计算阈值的模型数量将以超线性方式增加——即每个连续年份将有更多新模型被捕捉到该阈值内。以迄今为止最大的训练运行为基础定义的阈值(例如,所有处于当前最大训练运行量一个数量级以内的模型都被捕捉到)显示出了更稳定的趋势,从2025年到2028年,每年将有14-16个模型被捕捉到这一定义之下。
发布时间: 4/24/2025
查看原文
作者: Milad Leyli-abadi, Ricardo J. Bessa, Jan Viebahn, Daniel Boos, Clark Borst, Alberto Castagna, Ricardo Chavarriaga, Mohamed Hassouna, Bruno Lemetayer, Giulia Leto, Antoine Marot, Maroua Meddeb, Manuel Meyer, Viola Schiaffonati, Manuel Schneider, Toni Waefler
arXiv:2504.16133v1 安全信息:交叉 摘要:人类与AI在安全关键系统中的交互提出了一组独特的挑战,这些挑战在现有框架中部分未得到解决。这些挑战源自透明度、信任和解释性要求的复杂相互作用,以及进行安全可靠的决策的必要性。一个全面整合人类和AI能力的框架,同时解决这些关切问题,显然是必要的,有助于在设计、部署和维护安全有效的系统方面填补关键缺口。本文通过采用跨学科的方法,为关键基础设施提出了一种全面的概念性框架。该框架整合了传统上各自独立的领域,如数学、决策理论、计算机科学、哲学、心理学和认知工程,并借鉴了特别的相关工程领域,特别是能源、移动性和航空。此外,还通过在现有框架上实现该框架展示了其采用的灵活性。
发布时间: 4/24/2025
查看原文
作者: Andrew M. Olney, Sidney K. D'Mello, Natalie Person, Whitney Cade, Patrick Hays, Claire W. Dempsey, Blair Lehman, Betsy Williams, Art Graesser
arXiv:2504.16132v1 宣告类型: 交叉 摘要:辅导在促进学习方面是非常有效的。然而,专业知识对辅导效果的贡献尚不清楚且一直存在争议。我们对一种以专家人类导师为模型的生物学智能辅导系统(ITS)进行了9周的学习有效性研究,其中有两个控制组:仅在领域内是专家但不擅长辅导的真人导师和无辅导条件。所有条件都是课堂指导的补充,学生在每次辅导前后立即进行学习测试,并且在辅导后1-2周进行延迟测试。使用逻辑混合效应模型进行的分析表明,对于ITS(d=0.71)和人类导师(d=0.66)的即时后测有显著正向影响,这些效果在元分析效应中处于第99百分位;对于延迟后测,对于ITS(d=0.36)和人类导师(d=0.39)也有显著正向影响。我们讨论了专业知识在辅导中的作用以及未来研究设计的含义。
发布时间: 4/24/2025
查看原文
作者: Samuel Yen-Chi Chen, Zhiding Liang
arXiv:2504.16131v1 类型: cross 摘要:量子计算(QC)和机器学习(ML)的最新进展激发了将这两种变革性技术结合的研究努力。量子机器学习(QML),一个新兴的跨学科领域,利用量子原理来提升机器学习算法的性能。与此同时,系统化和自动化设计高性能量子电路架构的方法在量子机器学习任务中的应用日益受到关注,因为这些方法使量子计算领域的外行人能够有效地利用量子增强的工具。本教程将对两个领域的近期突破进行深入概述,强调它们有潜力扩展QML在各个领域的应用范围。
发布时间: 4/24/2025
查看原文
arXiv:2504.16130v1 宣布类型: cross 摘要:拉曼光谱作为一种强大的工具,用于分析物质的化学信息。结合拉曼光谱与深度学习方法能够实现快速的定性和定量材料分析。大多数现有方法采用监督学习方法。尽管监督学习在光谱分析中已经达到了令人满意的准确度,但仍然受限于标注数据集的成本高昂和数量有限。当光谱标注具有挑战性或标注数据量不足时,监督学习在光谱材料识别方面的表现会下降。为了解决从未标注光谱中提取特征的挑战,我们提出了一个基于掩码自编码器的自监督学习范式,称为SMAE。SMAE在预训练过程中不需要任何光谱标注。通过随机掩码和随后重构光谱信息,模型学习到关键的光谱特征。重构后的光谱具有一定的去噪性质,使得信噪比(SNR)提高了一倍多。利用掩码预训练所获得的网络权重,SMAE在病原菌菌株数据集中达到80%以上的聚类准确率,相比经典的无监督方法和其它最先进的深度聚类方法显示出显著改进。在使用有限标注数据对网络进行微调后,SMAE在测试集上的识别准确率为83.90%, competing with supervised ResNet(83.40%)。
发布时间: 4/24/2025
查看原文
作者: Junwei Liao, Muning Wen, Jun Wang, Weinan Zhang
arXiv:2504.16129v1 交叉公告类型 摘要:基于LLM的多智能体系统在解决需要多方面推理和协作的复杂、代理性任务方面展示了显著的能力,从生成高质量的演示文稿到进行复杂的科学研究。与此同时,强化学习因其在增强智能代理方面的有效性而广受认可,但对使用基础RL技术微调LaMAS的研究有限。此外,直接将MARL方法应用于LaMAS引入了重大挑战,这些挑战源自LaMAS固有的特性和机制。为了解决这些问题,本文对基于LLM的MARL进行了全面研究,并提出了一种新颖的范式,称为多智能体强化微调(MARFT)。我们介绍了一种通用的算法框架,专门针对LaMAS,概述了概念基础、关键区别和实用实现策略。首先,我们回顾了从RL到强化微调的发展,为多智能体领域中的并行分析奠定了基础。在LaMAS的背景下,我们阐明了MARL和MARFT之间的重要区别。这些区别促使我们转向一种新颖的、以LaMAS为导向的RFT形式。本文的核心在于展示了一个稳健且可扩展的MARFT框架。我们详细阐述了核心算法,并提供了完整的开源实现,以促进采用和进一步的研究。论文的后部分探讨了MARFT在实际应用中的视角和开放挑战。通过将理论基础与实用方法相结合,本文旨在为寻求推进MARFT以实现稳健和自适应代理系统解决方案的研究人员提供路线图。我们提出的框架的实现可在以下网址获取:https://github.com/jwliao-ai/MARFT。
发布时间: 4/24/2025
查看原文
arXiv:2504.16128v1 类别: cross 摘要: 将深度学习应用集成到农业物联网系统中面临着平衡视觉变换器(ViTs)的高准确性和资源受限边缘设备的效率需求的严重挑战。像Swin Transformer这样的大型变换器模型在捕获全局-局部依赖关系方面表现优异,适用于植物病害分类。然而,它们的计算复杂度(34.1 GFLOPs)限制了其应用,并使其实时设备推理变得不切实际。MobileNetV3和TinyML等轻量级模型适合于设备推理,但缺乏用于精细粒度病害检测所需的空间推理能力。为了弥合这一差距,我们提出了一种混合知识蒸馏框架,该框架协同转移Swin Transformer教师模型的logit和注意力知识到MobileNetV3学生模型中。我们的方法包括引入自适应注意力对齐以解决跨架构不匹配(分辨率、通道数)问题,并且具有优化类别概率和空间焦点的双重损失函数。在lantVillage-Tomato数据集(18,160张图像)上,蒸馏后的MobileNetV3相对于Swin-L获得了92.4%的准确率,但其PC上的计算量减少了95%,物联网设备上的推理延迟也降至82%以下(PC CPU上的计算时间为23ms,智能手机CPU上的推理时间为86ms/张图像)。关键技术包括针对物联网设备的验证指标(13 MB内存,0.22 GFLOPs)和动态分辨率匹配注意力图。对比实验表明,相比独立的CNN和先前的蒸馏方法,这种方法取得了显著的效果改进,MobileNetV3基线模型的准确率提高了3.5%。更重要的是,这项工作推动了精准农业中实时、节能的作物监控,并展示了如何在边缘设备上实现与ViT相当的诊断精度。在接受后,代码和模型将被提供以便复现。
发布时间: 4/24/2025
查看原文