LLM2D

arXiv 论文列表

作者: Haoshuai Zhou, Boxuan Cao, Changgeng Mo, Linkai Li, Shan Xiang Wang
arXiv:2505.08215v1 通知类型: 新 摘要: 语音基础模型(SFM)在多种下游任务中表现出强大的性能,包括助听者的语音可懂度预测(SIP-HI)。然而,针对SIP-HI优化SFM的研究尚不够充分。本文我们进行了全面的研究,以5个SFM为基础,重点关注编码层选择、预测头架构以及集成配置,来识别影响SIP-HI性能的关键设计因素。我们的研究发现,与传统的使用所有层的方法相反,选择单一的编码层能获得更好的结果。此外,时间建模对于有效的预测头是至关重要的。我们还展示了多个SFM进行集成能提高性能,更强的个体模型能提供更大的好处。最后,我们探索了关键SFM属性与其对SIP-HI性能影响之间的关系。本文的研究为有效适应SFM进行助听者语音可懂度预测提供了实用的见解。
发布时间: 5/14/2025
查看原文
作者: Petrus H. Zwart, Tamas Varga, Odeta Qafoku, James A. Sethian
arXiv:2505.08176v1 宣布类型: 新论文 摘要:科学研究成像通常需要长时间获取高质量的数据,特别是在探测复杂、异质系统时。然而,减少获取时间以提高产量必然会引入显著的噪声。我们提出了一种机器学习方法,不仅能够通过校准的不确定性边界对低质量测量值进行去噪,还能揭示潜在空间中的新兴结构。通过使用通过同态分位数回归训练的轻量级、随机结构化的神经网络集合,我们的方法能够在无需标签或分割的情况下进行可靠的去噪并揭示可解释的空间和化学特征。与仅专注于图像恢复的传统方法不同,我们的框架利用去噪过程本身来驱动有意义的表示的出现。我们在实地地球生物化学成像数据上验证了这种方法,展示了它如何在资源受限的情况下支持自信的解释并引导实验设计。
发布时间: 5/14/2025
查看原文
作者: Andrew Cart, Shaohu Zhang, Melanie Escue, Xugui Zhou, Haitao Zhao, Prashanth BusiReddyGari, Beiyu Lin, Shuang Li
arXiv:2505.08163v1 声明类型: 新 摘要: 邻里环境包括住房质量、道路和人行道等物理和环境条件,这些条件对人类的健康和幸福感有显著影响。传统的评估这些环境的方法,包括实地调查和地理信息系统(GIS),资源密集且在大规模评估邻里环境时具有挑战性。尽管机器学习为自动化分析提供了潜力,但标注训练数据的过程繁琐,以及缺乏可访问的模型阻碍了其可扩展性。本研究探讨了使用大型语言模型(LLMs),如ChatGPT和Gemini,作为工具大规模解码邻里环境(例如,人行道和电力线)的可行性。我们训练了一个基于YOLOv11的稳健模型,在检测包括路灯、人行道、电力线、公寓、单车道道路和多车道道路在内的六种环境指标时,平均准确率达到99.13%。随后,我们评估了包括ChatGPT、Gemini、Claude和Grok在内的四种LLMs,以评估它们在识别这些指标方面的可行性、稳健性和局限性,重点研究了提示策略和微调的影响。我们使用前三名LLM的多数投票实现了超过88%的准确率,这表明LLMs可以作为无需训练努力解码邻里环境的有用工具。
发布时间: 5/14/2025
查看原文
作者: Weizhi Fei, Zihao Wang, hang Yin, Shukai Zhao, Wei Zhang, Yangqiu Song
arXiv:2505.08155v1 宣告类型: new 摘要: 复杂查询回答(CQA)旨在从不完整知识图中检索复杂逻辑公式的问题集,这是知识图推理中的一项关键而具有挑战性的任务。虽然神经符号搜索利用神经链接预测实现了卓越的准确性,但它们遇到了显著的复杂性瓶颈:(i) 数据复杂性通常随着知识图中的实体数量呈二次增长,(ii) 循环查询的查询复杂性变为NP难问题。因此,这些方法难以有效扩展到更大的知识图和更复杂的查询。为解决这些挑战,我们提出了一种高效且可扩展的符号搜索框架。首先,我们提出了两种约束策略来计算神经逻辑索引,以减少变量的取值范围,从而降低符号搜索的数据复杂性。此外,我们引入了一个基于局部搜索的近似算法来解决循环查询的NP查询复杂性问题。在各种CQA基准测试上的实验表明,我们的框架在保持近似相同性能的同时将符号方法的计算负担降低了90%,从而缓解了效率和可扩展性问题。
发布时间: 5/14/2025
查看原文
作者: Joey Chan, Zhen Chen, Ershun Pan
arXiv:2505.08151v1 公告类型:新 摘要:准确估计锂离子电池容量退化对于提高电池操作的可靠性和安全性至关重要。传统专家模型针对特定场景进行了定制,提供了孤立的估计。随着数据驱动技术的快速发展,一系列通用时间序列基础模型已经开发出来。然而,专门针对电池容量退化设计的基础模型仍然很少见。为了在电池退化预测中利用大型模型技术实现零样本泛化,本研究提出了一种针对时间序列基础模型的退化感知微调策略。我们将该策略应用于在大约10 GB的开源电池充放电数据上微调Timer模型。在我们发布的CycleLife-SJTUIE数据集上的验证表明,微调后的Battery-Timer在容量退化预测中具有强大的零样本泛化能力。为了应对部署大型模型的计算挑战,我们进一步提出了一种知识蒸馏框架,将预训练基础模型的知识转移到紧凑的专家模型中。跨多个先进时间序列专家模型的蒸馏结果证实,基础模型知识显著提高了专家模型的多条件泛化能力。
发布时间: 5/14/2025
查看原文
作者: Tobias Schnabel, Kiran Tomlinson, Adith Swaminathan, Jennifer Neville
arXiv:2505.08140v1 宣布类型: 新 摘要: 尽管它们在许多任务上取得了巨大的成功,基于变压器的大规模语言模型(LLMs)仍然在要求对输入的大量部分进行复杂推理的任务上遇到困难。我们认为这些失败是由于LLMs内部信息准确流动的能力限制所导致的。为了正式化这一问题,我们引入了有界注意力前缀先验(BAPO)模型,这是一种新的计算框架,用于建模LLMs内部通信机制(即注意力头)的带宽限制。我们展示了几个重要的推理问题,如图的可达性,需要BAPOs具备高通信带宽来解决;我们将这些问题称为BAPO-hard。我们的实验验证了我们的理论预测:GPT-4、Claude和Gemini在BAPO-容易的任务上取得成功,但在相对较小型的BAPO-hard任务上却失败了。BAPOs还揭示了另一种思维链(CoT)的优势:我们证明,使用CoT分解任务可以将任何BAPO-hard问题转换为BAPO-容易的问题。我们的结果为关键LLM失败提供了有原则的解释,并建议了缓解带宽限制的架构和推理方法的方向。
发布时间: 5/14/2025
查看原文
作者: Madhuri Singh, Amal Alabdulkarim, Gennie Mansi, Mark O. Riedl
arXiv:2505.08073v1 通告类型: 新 摘要: 可解释的人工智能(XAI)系统被提出以帮助人们理解人工智能系统是如何产生输出和行为的。由于 sequential 决策的时序特性,解释可强化学习(XRL)具有额外的复杂性。此外,非AI专家不一定有能力修改代理或其策略。我们介绍了一种使用世界模型来为基于模型的深度强化学习代理生成解释的技术。世界模型预测在执行动作时世界将如何变化,从而允许生成反事实轨迹。然而,仅了解用户想要代理做什么还不足以理解代理为什么做了其他事情。我们通过添加一个逆向世界模型来增强基于模型的RL代理,该逆向世界模型预测为了使代理偏好一个给定的反事实动作,世界的状态应该是什么样的。我们展示了向用户展示世界应该是什么样的解释可以显著提高他们对代理策略的理解。我们假设我们的解释可以帮助用户通过操控环境来学习如何控制代理的执行。
发布时间: 5/14/2025
查看原文
arXiv:2505.08049v1 宣告类型: 新增 摘要: 近期研究表明,在两项伯努利奖品实验(TABB)任务中,人类行为可以用正性偏差和证实偏差来描述,这意味着人类在客观上并未整合新信息。然而,我们发现,即使代理是通过客观贝叶斯推断来更新其信念,使用非对称学习率适应标准的Q学习模型仍然能够恢复这两种偏差。将贝叶斯推断作为有效的Q学习算法,其学习率是对称的,尽管是递减的。我们通过使用主方程分析这些学习系统的随机动态来解释这一点。我们发现,证实偏差和无偏但递减的学习率都能产生相同的行为特征。最后,我们提出了一套实验方案,以区分真正的认知偏差和递减学习率引起的伪象。
发布时间: 5/14/2025
查看原文
作者: Bernardo Cuenca Grau, Przemys{\l}aw A. Wa{\l}\k{e}ga
arXiv:2505.08021v1 声明类型: 新 摘要: 图 neural 网络(GNNs)解决了将深度学习应用于图结构数据时的两个关键挑战: 他们可以处理大小各异的输入图,并且确保在图形同构下的不变性。尽管 GNNs 已展现出广泛的应用性,但对其表达能力的理解仍是一个重要的问题。在本文中,我们证明了有界 GNN 架构对应于特定的一阶逻辑(FO)片段,包括模态逻辑(ML)、量词化模态逻辑(GML)、带普遍量词的模态逻辑(ML(A))、两个变量片段(FO2)及其扩展的计数量词(C2)。为了建立这些结果,我们使用了一阶逻辑和模态逻辑的一致模型理论的方法和工具,在图表示学习领域进行应用。这为在 FO 内理解 GNN 的逻辑表达能力提供了一个统一的框架。
发布时间: 5/14/2025
查看原文
arXiv:2505.07882v1 安全管理类型: 新闻 摘要: 连接式自主车辆(CAVs)在动态、开放且多领域的网络中运作,这使其成为各种威胁的目标。信任管理系统(TMS)系统地组织信任机制中的关键步骤,识别内部威胁和外部威胁中的恶意节点,并确保更合作任务中的可靠决策。机器学习(ML)的最新进展为增强TMS提供了巨大的潜力,尤其是对于CAVs的严格要求,例如CAV节点以不同速度移动,以及机会性和间歇性的网络行为。这些特征将基于ML的TMS与社交网络、静态IoT以及Social IoT区分开来。本文综述提出了一种新颖的三层基于机器学习(ML)的TMS框架,适用于车辆-道路-云集成系统,即信任数据层、信任计算层和信任激励层。提出了六维目标分类。此外,分析了每一层中每个模块的机器学习方法的原则。然后,根据与所提目标相反的交通场景,对现有研究进行了分类。最后,提出了未来方向,以解决开放问题并符合研究趋势。我们维护一个活跃的仓库,其中包含最新的文献和开源项目,网址为https://github.com/octoberzzzzz/ML-based-TMS-CAV-Survey。
发布时间: 5/14/2025
查看原文