LLM2D

arXiv 论文列表

arXiv:2504.05951v1 宣告类型: 新 摘要: 合规检查是确定受监管实体是否遵守这些规定的过程。目前,合规检查主要依赖人工操作,需要大量的时间和高技能专家,仍然容易受到人为因素引起错误的影响。尽管已经探索了多种自动化合规检查的方法,但在OWL DL语言中表示规定并通过OWL推理进行合规检查的做法尚未被采用。在这项工作中,我们提出了一种注解方案和一个算法,将文本注解转换为机器可解释的OWL DL代码。通过在建筑施工领域示例上实施概念验证实现来验证提出的方法。
发布时间: 4/9/2025
查看原文
作者: Zhuoli Zhuang, Cheng-You Lu, Yu-Cheng Fred Chang, Yu-Kai Wang, Thomas Do, Chin-Teng Lin
arXiv:2504.05950v1 通知类型: 新增 摘要: 提高自主智能车辆(AIVs)的决策能力已成为近年来的一个热门话题。尽管取得了进步,但训练机器捕捉对于全面场景理解至关重要的区域,如人类感知和推理,仍然是一个重大挑战。本研究引入了新型框架,基于人类注意力的可解释指导智能车辆系统(AEGIS)。AEGIS 利用从眼动追踪转换而来的人类注意力来指导强化学习(RL)模型识别决策中关键的区域。AEGIS 使用预训练的人类注意力模型来引导 RL 模型识别决策中的关键区域。通过来自六种场景的 20 名参与者的 120 万帧数据收集,AEGIS 预训练了一个模型来预测人类注意力模式。
发布时间: 4/9/2025
查看原文
作者: Jinping Lei, Toru Takisaka, Junqiang Peng, Mingyu Xiao
arXiv:2504.05874v1 通知类型: 新 摘要: 本文提出了一种新颖的方法来确定基于哈希的近似模型计数算法 $\mathsf{ApproxMC}$ 的内部参数。在这个问题中,所选择的参数值必须确保 $\mathsf{ApproxMC}$ 是几乎正确的(Probably Approximately Correct, PAC),同时也要使其尽可能高效。现存的方法依赖于启发式方法;而本文则通过将 $\mathsf{ApproxMC}$ 的正确性证明推广到任意参数值来将其形式化为一个优化问题,从而解决了这个问题。我们的方法将算法的正确性和最优性问题分离,使我们能够在不需要重复的案例论证的情况下解决前者,同时为后者提供了一个清晰的框架。此外,在简化后,形成的优化问题具有异常简单的形式,使得基本的搜索算法得以使用,并有助于理解参数值如何影响算法性能。实验结果表明,我们的优化参数可以将最新 $\mathsf{ApproxMC}$ 的运行时间性能提高1.6到2.4倍,具体取决于容许的误差范围。
发布时间: 4/9/2025
查看原文
作者: Kaibo Huang, Zhongliang Yang, Linna Zhou
arXiv:2504.05871v1 宣传类型: 新 摘要: 随着智能代理在数字生态系统中的日益部署,如社交媒体平台,对可追溯性和问责制的关注显著增加,特别是在网络安全和数字内容保护方面。传统的大型语言模型(LLM)水印技术依赖于令牌级别的修改,对于代理来说由于行为令牌化和行为到行动转换中的信息丢失的挑战而不太适合。为了解决这些问题,我们提出了一种名为Agent Guide的新颖行为水印框架,通过概率偏置引导代理的高层次决策(行为),同时保持特定执行(行动)的自然性。我们的方法将代理行为分为两个层级,即行为(例如,选择书签)和行动(例如,带有特定标签的书签),并在行为概率分布中应用水印引导的偏置。我们采用基于z统计量的统计分析来检测水印,确保在多轮中可靠提取。在具有多样化代理配置文件的社交媒体场景中的实验表明,Agent Guide实现了有效的水印检测,并且误检率较低。我们的框架提供了一种实用且 robust的代理水印解决方案,适用于识别恶意代理并保护专有代理系统。
发布时间: 4/9/2025
查看原文
作者: Takehiro Takayanagi, Kiyoshi Izumi, Javier Sanz-Cruzado, Richard McCreadie, Iadh Ounis
arXiv:2504.05862v1 通告类型: 新 摘要: 基于大规模语言模型的代理正在成为一种低成本机制,用于提供个性化且富有对话性的建议,已经在相对简单的场景中展示了令人印象深刻的性能,例如电影推荐。但在复杂且高风险的领域,如金融领域,这些代理的表现如何呢?在这种领域,专业领域的知识是必不可少的,错误可能会带来重大风险。本文探讨了在金融领域大规模语言模型代理的有效性,重点关注三个独特的挑战:(1)当用户自身可能对其需求也不确定时,引起用户的偏好;(2)为不同的投资偏好提供个性化的指导;(3)利用顾问的性格特征来建立关系并促进信任。通过一项包含64名参与者的实验室用户研究,我们展示了当引起偏好时,大规模语言模型代理往往能与人类顾问的表现相当,尽管它们可能难以解决冲突的用户需求。在提供个性化建议时,大规模语言模型能够积极影响用户行为,但显示出明显的失败模式。我们的结果显示,准确地引起偏好是关键的,否则,大规模语言模型代理几乎没有影响,甚至可能将投资者引导到不合适的资产上。更令人担忧的是,用户似乎对所提建议的质量不敏感,甚至更糟糕的是,建议的质量可能与用户的需求呈反比。事实上,用户表示更喜欢并且对采用外向人格特征的大规模语言模型更为满意,并且产生了更多的情感信任,尽管这些代理提供的建议反而更差。
发布时间: 4/9/2025
查看原文
作者: Seungyoon Woo, Junhyeog Yun, Gunhee Kim
arXiv:2504.05806v1 类型:新 摘要:神经场(NF)已成为一种多功能框架,适用于复杂的数据表示。本文提出了一种新的问题设置,称为“神经场的元持续学习”(MCL-NF),并介绍了一种新的策略,该策略结合了模块化架构和基于优化的元学习。专注于克服现有神经场持续学习方法的局限性,如灾难性遗忘和缓慢收敛,我们的策略实现了高质量的重构,显著提高了学习速度。我们还引入了神经辐射场的 Fisher 信息最大化损失(FIM-NeRF),该损失在样本级别最大化信息增益,以增强学习泛化能力,并证明了收敛性保证和泛化界。我们在六种不同的数据集上对图像、音频、视频重构和视图合成任务进行了广泛评估,展示了我们的方法在重构质量和速度方面优于现有的MCL和CL-NF方法。值得注意的是,我们的方法在减少参数要求的同时,实现了对大规模城市NeRF渲染的快速适应。
发布时间: 4/9/2025
查看原文
arXiv:2504.05801v1 通知类型: 新 摘要: 在对话系统中,基于上下文动态生成后续问题可以帮助用户探索信息并提供更好的用户体验。人类通常能够提出涉及一些日常生活知识并展示较高阶认知能力的问题。然而,现有的方法生成的问题往往局限于浅层的上下文问题,缺乏吸引力且与人类水平存在较大差距。在本文中,我们提出了一种三阶段的外部知识增强的后续问题生成方法,该方法通过识别上下文主题、在线构建知识图谱(KG),最后将这些内容与大语言模型结合以生成最终问题。模型通过引入外部常识知识并执行知识融合操作,生成信息丰富且具有探索性的后续问题。实验结果显示,与基线模型相比,我们的方法生成的问题更具信息量,更接近人类的提问水平,同时保持了上下文的相关性。
发布时间: 4/9/2025
查看原文
作者: Tianqi Ding, Dawei Xiang, Tianyao Sun, YiJiashum Qi, Zunduo Zhao
arXiv:2504.05728v1 宣布类型: 新 摘要:本文对AI驱动的锂离子电池健康状态(SoH)预测进行了全面回顾。我们比较了各种AI算法(包括FFNN、LSTM和BiLSTM)在CALCE、NASA和UDDS等多个数据集和不同场景(例如,不同温度和驾驶条件)下的有效性。此外,我们分析了影响SoH波动的因素,如温度和充放电速率,并通过仿真验证了我们的发现。结果表明,BiLSTM取得了最高的准确性,与LSTM相比,平均RMSE降低了15%,突显了其在实际应用中的稳健性。
发布时间: 4/9/2025
查看原文
作者: Jinghua Groppe, Andreas Marquet, Annabel Walz, Sven Groppe
arXiv:2504.05711v1 公告类型: 新 摘要: 遵守存档标准需要专门的知识,而手动为存档材料创建元数据描述既乏味又容易出错。本文旨在探索自主人工智能和大型语言模型(LLMs)在实施标准化存档描述流程中的潜在应用。为此,我们介绍了一个基于自主人工智能的系统,用于自动生成高质量的存档材料元数据描述。我们开发了一种联邦优化方法,将多个LLM的智能联合起来构建最优的存档元数据。我们还提出了一种方法,以克服使用LLM实现一致元数据生成所面临的挑战。为了评估我们技术的可行性和有效性,我们在一个涵盖各种文档类型和数据格式的真实数据集上进行了广泛的实验。评估结果表明了我们技术的可行性,并突显了与单模型解决方案相比,联邦优化方法在元数据质量和可靠性方面的优越性能。
发布时间: 4/9/2025
查看原文
作者: Sudeshna Jana, Manjira Sinha, Tirthankar Dasgupta
arXiv:2504.05691v1 通知类型: 新 摘要: 准确预测医院住院时间(LOS)对于提高医疗服务、资源管理和成本效率至关重要。本文介绍了StayLTC,这是一种用于利用液态时间常数网络(LTCs)预测实时医院LOS的多模态深度学习框架。LTCs因其连续时间循环动力学,通过电子健康记录(EHRs)和临床笔记中的结构化数据与传统模型进行了比较。我们在MIMIC-III数据集上进行的评估表明,LTCs显著优于其他大多数时间序列模型,提供了更高的准确性、更强的鲁棒性和更高效的资源利用。此外,LTCs在LOS预测方面的表现与时间序列大型语言模型相当,但所需的计算能力和内存却显著较少,突显了其在医疗保健领域推进自然语言处理(NLP)任务的潜力。
发布时间: 4/9/2025
查看原文