LLM2D

arXiv 论文列表

作者: Rabia Yasa Kostas, Kahraman Kostas
arXiv:2505.08088v1 宣告类型: 交叉 摘要:室内定位系统(IPSs)在复杂的多层环境中的位置服务中变得越来越重要。本研究提出了一种基于图的创新方法,使用Wi-Fi指纹轨迹进行楼层分离,以应对室内环境中的垂直定位挑战。我们构建了一个图,其中节点表示Wi-Fi指纹,边的权重由信号相似性和上下文转换决定。使用Node2Vec生成低维嵌入,并将其后续聚类以识别不同的楼层。在2021年华为大学挑战集上进行评估,我们的方法优于传统社区检测算法,准确率为68.97%,F1分数为61.99%,调整兰德指数为57.19%。通过公开预处理数据集和实现代码,本项工作为室内定位研究的进步做出了贡献。提出的方法具备对信号噪声和建筑复杂性的鲁棒性,为楼层级别的定位提供了可扩展的解决方案。
发布时间: 5/14/2025
查看原文
arXiv:2505.08082v1 宣告类型:交叉 摘要:近年来,智能电网中的生成型人工智能(AI)模型取得了显著进步,这得益于它们能够生成大量合成数据,而在实际世界中,由于机密性限制,获取这些数据通常是困难的。利用此类合成数据的关键挑战是如何评估生成模型产生的数据质量。传统的基于欧几里得距离的度量只能反映两个个体样本之间的成对关系,并且在评估合成数据集组之间的质量差异时可能会失效。在本文中,我们提出了一种基于在学习特征空间中估计的两点间弗雷彻距离(FD)的新度量方法。所提出的 метод 从分布的角度评估生成的质量。实证结果显示,所提出的度量方法在不同时间和模型中均表现出优越性,增强了基于数据驱动的决策在智能电网操作中的可靠性。
发布时间: 5/14/2025
查看原文
作者: Dong Shu, Xuansheng Wu, Haiyan Zhao, Mengnan Du, Ninghao Liu
arXiv:2505.08080v1 交叉公告类型: cross 摘要: 稀疏自编码器(SAEs)最近已成为解读和控制大型语言模型(LLMs)内部表示的强大工具。然而,传统分析SAE的方法通常仅依赖于输入端的激活,而不考虑每个潜在特征与模型输出之间的因果影响。本文基于两个关键假设:(1)激活的潜在特征并不以相同的方式参与模型输出的构建,(2)只有具有高因果影响的潜在特征才有效用于模型控制。为了验证这些假设,我们提出了梯度稀疏自编码器(GradSAE),这是一种简单而有效的方法,通过结合输出端的梯度信息来识别最具影响力的潜在特征。
发布时间: 5/14/2025
查看原文
作者: Perry Dong, Suvir Mirchandani, Dorsa Sadigh, Chelsea Finn
arXiv:2505.08078v1 公告类型:交叉 摘要:从大量自主收集的数据中学习以改进策略——我们称之为批在线强化学习的一种范式——有望通过大幅减少数据收集所需的人力努力,同时利用自我改进的好处,使真正的可扩展机器人学习成为可能。然而,尽管这种范式具有潜在的优势,但在实现上仍然具有挑战性,因为算法无法有效从自主数据中学习。例如,之前的研究将模仿学习和过滤模仿学习方法应用于批在线RL问题,但这些算法往往无法有效地从自主收集的数据中进行改进,或者快速收敛到次优点。这提出了一个问题,即在机器人中,什么是有效的批在线RL的关键。受这一问题的启发,我们对三个维度进行了系统的实验研究——(i)算法类别,(ii)策略提取方法,以及(iii)策略表达能力——并分析这些维度如何影响性能和随自主数据量增加的扩展性。通过我们的分析,我们得出了几个观察结果。首先,我们发现使用Q函数来引导批在线RL可以显著提高性能,胜过基于模仿的方法。在此基础上,我们表明,通过选择策略分布中的最佳行动的隐式策略提取方法是必要的,而不同于传统的来自离线RL的策略提取方法。接着,我们表明,具有较强表达能力的策略类别比较弱表达能力的策略类别更受欢迎。基于这些分析,我们提出了一个通用的批在线RL有效性的食谱。随后,我们展示了在食谱中使用时间相关噪声的简单添加,以获得更多的多样性,从而进一步提高性能。我们的食谱与先前的方法相比,获得了显著更好的性能和扩展性。
发布时间: 5/14/2025
查看原文
作者: Alpay Sabuncuoglu, Christopher Burr, Carsten Maple
arXiv:2505.08064v1 宣言类型:交叉 摘要:人们普遍认识到,确保公平的AI系统是一个复杂的社会和技术挑战,需要在整个系统生命周期中仔细考虑和持续监督,从定义需求到模型部署和撤销。动态基于论证的保证案例,这是一种结构化的证据支持论证方法,已经作为一种系统方法出现,用于评估和减轻AI启用系统开发中的安全风险和危害,并且已经被扩展到处理更广泛规范性目标,如公平性和解释性。本文介绍了一种基于系统工程的框架,辅以软件工具,在两个阶段中实现动态基于论证的保证方法。在第一阶段,在需求规划阶段,多学科和多利益相关者团队通过进行全面的公平治理过程来定义需要建立(并提供证据)的目标和主张。在第二阶段,持续监控界面收集来自现有 artefacts(例如自动测试的指标)的证据,如模型、数据和用例文档,以动态支持这些论证。通过金融领域的示例案例研究证明了该框架的有效性,重点关注支持与公平性相关的论证。
发布时间: 5/14/2025
查看原文
arXiv:2505.08054v1 公告类型: cross 摘要:在大规模语言模型(LLMs)中,安全对齐方法往往会导致对良性查询的过度拒绝,显著降低了它们在敏感场景中的实用性。为了解决这一挑战,我们引入了FalseReject,这是一个包含16,000个看似有毒查询及其在44个安全相关类别中的结构化响应的综合资源。我们提出了一种基于图的信息对抗多智能体交互框架,以生成多样且复杂的提示,并通过明确的推理结构化响应,帮助模型准确区分安全与不安全的上下文。FalseReject包括针对标准指令微调模型和推理导向模型的定制训练数据集,以及一个附有人工标注的基准测试集。我们在29个最先进的(SOTA)LLMs上的广泛基准测试显示了持续存在的过度拒绝挑战。实证结果表明,使用FalseReject的监督微调显著减少了不必要的拒绝,而不会牺牲整体安全或通用语言能力。
发布时间: 5/14/2025
查看原文
作者: Kourosh Shahnazari, Seyed Moein Ayyoubzadeh
arXiv:2505.08052v1 类型:交叉 摘要:本研究通过构建多维相似性网络,正式化了一个计算模型来模拟古典波斯诗人的影响动态。基于 Ganjoor 的语料库,我们使用严格筛选的数据集,结合语义、词汇、风格、主题和韵律特征,划分每个诗人的语料库。每个语料库都包含在带权重的相似性矩阵中,然后将这些矩阵附加到一起生成一张展示诗人之间影响的综合图。通过计算度数、接近度、介数中心性、特征向量和 Katz 中心性度量,进一步对网络进行研究以识别关键诗人、风格中心以及连接诗人。此外,为了获得类型的见解,我们使用 Louvain 社区检测算法来划分既具有风格又具有主题连贯性的诗人集群,这与承认的文学流派,如印地学校、库尔舍尼学校以及文学回潮现象(Bazgasht-e Adabi)相对应。我们的研究结果提供了一种基于数据的新视角,区分经典意义和文本间影响,从而突显那些尽管知名度较低但在结构上意义重大的人物。结合计算语言学与文学研究,本文构建了一种可解释且可扩展的诗歌传统模型,使数字人文领域内的回顾性反思以及前瞻性研究成为可能。
发布时间: 5/14/2025
查看原文
作者: Seyed Bagher Hashemi Natanzi, Zhicong Zhu, Bo Tang
arXiv:2505.08032v1 类型: cross 摘要:在6G网络中,高频、移动性和遮挡对自适应波束切换提出了挑战。我们提出了一种基于深度强化学习(DRL)的在线学习框架,该框架采用增强的状态表示(速度和遮挡历史)、GRU架构以及优先经验回放,以实现实时波束优化。通过Nvidia Sionna在时间相关遮挡下的验证,我们的方法在信噪比(SNR)、吞吐量和准确性方面显著增强了稳健性,相比传统启发式方法。此外,增强的DRL代理通过利用时间依赖性,表现出优于反应式多臂赌博机(MAB)基线的效果,实现了较低的性能变异性。这证明了记忆和优先学习对于 robust 6G波束管理的好处,同时确认了MAB作为强基线的有效性。
发布时间: 5/14/2025
查看原文
作者: Hannah Lee, Zachary Serlin, James Motes, Brendan Long, Marco Morales, Nancy M. Amato
arXiv:2505.08025v1 Announce Type: cross 摘要:我们介绍了PRISM(Pathfinding with Rapid Information Sharing using Motion Constraints),这是一种去中心化的算法,旨在解决多任务多智能体路径规划(MT-MAPF)问题。PRISM允许大量智能体同时规划多个任务的安全且高效的路径,同时避免碰撞。它采用了一种快速通信策略,使用信息包交换运动约束信息,增强协作路径规划和情况感知能力,即使在没有直接通信的情况下也能实现。我们证明了当有可能时,PRISM能够解决并避免所有死锁场景,这是去中心化路径规划中的一大关键挑战。实验中,我们评估了PRISM在五个环境和25个随机场景中的表现,将其与中心化的冲突基于搜索(CBS)以及去中心化的令牌传递和任务互换(TPTS)算法进行了基准测试。PRISM展示了可扩展性和解决方案质量,支持的智能体数量是CBS的3.4倍,在狭窄通道环境中处理的任务数量是TPTS的2.5倍以上。此外,PRISM在解决方案质量方面与CBS相当,即使在低连接性条件下也能实现更快的计算时间。其去中心化的设计减轻了单个智能体的计算负担,使其能够适用于大型环境。这些结果证实了PRISM在复杂和动态路径规划场景中的稳健性、可扩展性和有效性。
发布时间: 5/14/2025
查看原文
作者: Haneh Rhel, Dmitri Roussinov
arXiv:2505.08004v1 交叉公告类型 摘要:在过去三年里,大型语言模型(LLMs)的快速发展对人工智能的多个领域产生了深远影响,特别是在多种语言的自然语言处理(NLP)方面,包括阿拉伯语。尽管阿拉伯语是阿拉伯世界27个国家中最广泛使用的语言之一,并且在一些非阿拉伯国家也被用作第二语言,但阿拉伯语资源、数据集和工具仍然稀缺。由于阿拉伯语的丰富形态、复杂的结构、多样化的书写标准等复杂性因素,阿拉伯语NLP任务面临着各种挑战。研究人员一直在积极应对这些挑战,表明在多语言语料库上预训练的大型语言模型在多种阿拉伯语NLP任务中取得了显著的成功。本文概述了使用大型语言模型(LLMs)进行阿拉伯语处理的情况,突出了跨多种NLP应用的早期预训练阿拉伯语模型及其处理多样化的阿拉伯语内容任务和方言的能力。此外,本文还概述了如何通过微调和提示工程等技术提高这些模型的性能。此外,本研究总结了常见的阿拉伯语基准和数据集,并呈现了我们对LLMs采用持续上升趋势的观察。
发布时间: 5/14/2025
查看原文