arXiv 论文列表

作者: Andreas Schlaginhaufen, Maryam Kamgarpour

arXiv:2406.01793v2 宣布类型: 替换-交叉摘要：逆强化学习（IRL）旨在从专家演示中推断出奖励，这一目标源于一种信念，即奖励而非策略是任务最简洁和可转移的描述[Ng等人，2000]。然而，与最优策略相对应的奖励并不是唯一的，因此不清楚根据IRL学习得到的奖励是否在新的转换法则下具有可转移性，其最优策略能与专家真实奖励对应的最优策略对齐。过去的研究仅在完全访问专家策略的假设下解决了这一问题，且仅当从具有相同奖励但不同满足特定条件的转换法则的两名专家处学习时，才能保证可转移性[Rolland等人，2022]。在本文中，我们展示了在仅能访问专家演示这一更实际的情况下，用于完全访问专家策略的条件不能保证在任何转换法则下的可转移性。我们提出使用主角度作为测量转换法则相似性和差异性的更精细度量，而不是二元秩条件。在此基础上，我们建立了两个关键结果：1) 当至少从两名具有足够不同的转换法则的专家处学习时，可转移性的充分条件；2) 在从单个专家处学习时，可转移性针对转换法则局部变化的充分条件。此外，我们还提供了一种可能近似正确的（PAC）算法，并对从多名专家的演示中学习可转移奖励进行了端到端的分析。

发布时间: 2/5/2025

查看原文

我的数据在我的检索数据库中吗？针对检索增强生成的成员推理攻击

作者: Maya Anderson, Guy Amit, Abigail Goldsteen

arXiv:2405.20446v3 通告类型：替换交叉摘要：检索增强生成（RAG）系统在自然语言处理方面展现出了巨大的潜力。然而，它们依赖于存储在检索数据库中的数据，这些数据可能包含专有或敏感信息，这引入了新的隐私问题。具体来说，攻击者可能通过观察RAG系统的输出来推断某个文本片段是否出现在检索数据库中，这种攻击被称为成员推理攻击（MIA）。尽管这种威胁的重要性不容忽视，但针对RAG系统的MIA研究仍然相对不足。本研究通过引入一种高效且易于使用的MIA方法来填补这一空白。我们使用两个基准数据集和多种生成模型展示了该攻击的有效性，表明在黑盒和灰盒设置下，可以通过创建合适的提示来高效地确定文档在检索数据库中的成员身份。此外，我们提出了一种初步的防御策略，即在RAG模板中添加指令，该策略对某些数据集和模型显示出较高的有效性。我们的研究结果强调了在部署的RAG系统中实施安全对策和开发更先进的防御措施以保护检索数据库的隐私和安全的重要性。

发布时间: 2/5/2025

查看原文

深度学习库测试：定义、方法与挑战

作者: Xiaoyu Zhang, Weipeng Jiang, Chao Shen, Qi Li, Qian Wang, Chenhao Lin, Xiaohong Guan

arXiv:2404.17871v3 宣布类型: replace-cross 摘要：近年来，由深度学习（DL）技术驱动的软件系统在许多方面极大地方便了人们的生活。作为这些DL系统的支柱，各种DL库承担了底层的优化和计算任务。然而，就像传统的软件一样，DL库也不是免受错误的侵害，这些错误可能会对用户的个人财产和安全造成严重威胁。研究DL库的特点，与其相关的错误以及相应的测试方法对于提高DL系统的安全性以及推进DL技术的广泛应用至关重要。本文提供了与各种DL库相关的测试研究的综述，讨论了现有方法的优势和局限性，并为DL库的应用提供指导和参考。本文首先介绍了DL底层库的工作流程以及涉及三种类型的DL库——DL框架、DL编译器和DL硬件库——的特点。然后，本文为DL底层库错误和测试提供了定义。此外，本文总结了专门为这些DL库定制的现有测试方法和工具，并分析了它们的有效性和局限性。本文还讨论了DL库测试现有的挑战，并概述了未来研究的潜在方向。

发布时间: 2/5/2025

查看原文

通过缓慢变化序列实现稳定的机器学习模型重新训练

作者: Dimitris Bertsimas, Vassilis Digalakis Jr, Yu Ma, Phevos Paschalidis

arXiv:2403.19871v5 更新类型: replace-cross 摘要：我们考虑在新数据批次可用时重训练机器学习（ML）模型的问题。现有方法在每个批次上单独优化预测能力，而不考虑模型结构的稳定性或重训练迭代过程中的分析洞察。我们提出了一种模型通用框架，用于找到在重训练迭代过程中稳定的模型序列。我们开发了一种混合整数优化模型，保证能够恢复 Pareto 最优模型（按预测能力-稳定性权衡而言），并具有良好的泛化性能；同时提出了一种高效的多项式时间算法，实际表现良好。我们在保持一致的分析洞察方面进行了重点考虑，这对于模型可解释性、实现的简便性和增强用户的信任是重要的，我们通过自定义定义的距离度量将这些洞察直接融入优化问题中。我们跨多个模型（回归、决策树、提升树和神经网络）和应用领域（医疗保健、视觉和语言）评估了该框架，包括在一家大型美国医院的生产管道中的部署。我们发现，平均而言，预测能力减少2%可以使稳定性提升30%。

发布时间: 2/5/2025

查看原文

人们在解释自主车辆行为时赋予其目的：认知科学对可解释人工智能的启示

作者: Balint Gyevnar, Stephanie Droop, Tadeg Quillien, Shay B. Cohen, Neil R. Bramley, Christopher G. Lucas, Stefano V. Albrecht

arXiv:2403.08828v3 Announce Type: replace-cross 摘要：人们往往认为有效的面向人类中心的可解释人工智能（XAI）应当类似于人类的推理。然而，认知科学的概念如何有助于XAI的设计的实证研究却相对缺乏。基于认知科学的见解，我们提出了一种解释模式框架，以分析人们如何阐述解释，是否为机制性的、目的性的或反事实性的。通过自主驾驶这一复杂的安全关键领域，我们进行了两项实验，分别研究了（i）人们在14种独特场景下如何解释车辆的行为（N1=54），以及（ii）他们如何感知这些解释（N2=382），并整理了新颖的人类对自主驾驶决策的解释集（HEADD）数据集。我们的主要发现是，参与者认为目的性解释的质量显著高于反事实解释，感知的目的性是感知质量的最好预测器。根据我们的研究结果，我们认为在设计和评估XAI时，解释模式是一个重要的分析维度，并强调了对解释的认知机制进行原则性和实证理解的需求。HEADD数据集和我们的代码可在以下链接获取：https://datashare.ed.ac.uk/handle/10283/8930。

发布时间: 2/5/2025

查看原文

基于自编码器的通用表示学习以用于客户嵌入

作者: Jan Henrik Bertrand, David B. Hoffmann, Jacopo Pio Gargano, Laurent Mombaerts, Jonathan Taws

arXiv:2402.18164v2 通知类型: 替换-交叉摘要: 最近在表示学习方面的进展成功地利用了数据在各个领域的内在领域特定结构。然而，将以表格格式存储的多样且复杂的实体表示在一个潜在空间内仍然是一个挑战。在本文中，我们介绍了 DEEPCAE，这是一种用于多层收缩自编码器（CAE）的正则化项计算的新方法。此外，我们形式化了一个通用实体嵌入框架，并使用该框架实验证明了 DEEPCAE 在重构性能和下游预测性能上均优于所有其他测试的自编码器变体。值得注意的是，在与 13 个数据集上的堆叠 CAE 相比时，DEEPCAE 在重构误差上实现了 34% 的改进。

发布时间: 2/5/2025

查看原文

Nomic Embed: 训练一个可再现的长上下文文本嵌入器

作者: Zach Nussbaum, John X. Morris, Brandon Duderstadt, Andriy Mulyar

arXiv:2402.01613v2 宣告类型: replace-cross 摘要: 本技术报告描述了 nomic-embed-text-v1 的训练，这是第一个完全可再现、开源、开放权重、开放数据、上下文长度为 8192 的英文文本嵌入模型，其在短上下文 MTEB 基准和长上下文 LoCo 基准上均优于 OpenAI Ada-002 和 OpenAI text-embedding-3-small。我们以 Apache 2.0 许可证发布训练代码和模型权重。与其他开源模型不同，我们发布了完整的经过精心策展的训练数据和代码，允许完全复制 nomic-embed-text-v1。您可以在 https://github.com/nomic-ai/contrastors 找到用于复制模型的代码和数据。

发布时间: 2/5/2025

查看原文

嵌入式特征选择的模型输入-输出配置搜索用于传感器时间序列和图像分类

作者: Anh T. Hoang, Zsolt J. Viharos

arXiv:2310.17250v2 通知类型: 替换-交叉摘要：机器学习是一种强大的工具，能够从各类数据集中提取宝贵信息并进行各种预测。传统的机器学习算法依赖于明确定义的输入和输出变量；然而，在某些情况下，输入和输出变量之间的分离以及模型相关联的输入和输出层是未知的。特征选择（FS）和神经架构搜索（NAS）在这些情况下 emerged 作为颇具前景的解决方案。本文提出了 MICS-EFS，这是一种嵌入式特征选择的模型输入-输出配置搜索方法。该方法探索了涉及 1D 传感器时序数据和 2D 图像数据的分类任务中完整输入参数空间内的内部依赖关系。MICS-EFS 使用修改后的编码器-解码器模型和顺序前进搜索（SFS）算法，结合输入-输出配置搜索与嵌入式特征选择。实验结果表明，MICS-EFS 的性能优于其他特征选择算法。在所有测试数据集中，MICS-EFS 相对于基线模型的平均准确率提高了 1.5%，准确率提升范围从 0.5% 到 5.9%。此外，该算法将特征维度降低到原始数据的 2-5%，显著提高了计算效率。这些结果突显了 MICS-EFS 在提高各种机器学习任务中模型准确性和效率方面的潜力。此外，所提出的方法已在关注加工过程的实地工业应用中得到验证，进一步证明了它在解决复杂输入-输出挑战方面的有效性和实用性。

发布时间: 2/5/2025

查看原文

CROWN：一种新颖的用户偏好理解方法，用于准确的个性化新闻推荐

作者: Yunyong Ko, Seongeun Ryu, Sang-Wook Kim

arXiv:2310.09401v5 通知类型: replace-cross 摘要：个性化新闻推荐旨在帮助用户找到符合他们兴趣的新闻文章，这对于缓解用户信息过载问题起到了关键作用。尽管近年来已经研究了许多更好的个性化新闻推荐方法，但仍需更深入地探讨以下挑战：（C1）理解新闻文章中交织的多元意图，（C2）区分不同阅读后的新闻文章偏好变化，以及（C3）解决冷启动用户问题。为了一并应对上述挑战，在本文中，我们提出了一种新颖的个性化新闻推荐框架（CROWN），该框架采用了以下方法：（1）类别引导的意图分离以应对（C1），（2）一致性为基础的新闻表示以应对（C2），以及（3）GNN增强的混合用户表示以应对（C3）。此外，我们将类别预测作为辅助任务纳入CROWN的训练过程中，这为意图分离提供额外的监督信号。在两个真实世界的数据集上的广泛实验表明，（1）CROWN在十个最新的新闻推荐方法中提供了持续的性能提升，（2）所提出的方法显著提高了CROWN的准确性。

发布时间: 2/5/2025

查看原文

大规模语言模型：探究LLMs的元语言能力

作者: Ga\v{s}per Begu\v{s}, Maksymilian D\k{a}bkowski, Ryan Rhodes

arXiv:2305.00948v3 宣告类型: replace-cross 摘要：大型语言模型（LLMs）的性能最近已经提升到可以很好地完成许多语言任务的程度。我们在这里表明，这是首次，这些模型也可以生成有效的元语言分析。我们概述了一项研究计划，其中通过提示测试这些任务上 LLMs 的行为可解释性。由于这些模型主要是在文本上进行训练的——因此，评估它们的元语言能力提高了我们对其一般能力的理解，并为语言学中的理论模型提供了新的见解。我们展示了 OpenAI 的 o1 在涉及绘制句法树和音系概括的任务中远远超出其他模型的表现。我们推测，OpenAI o1 相对于其他模型的独特优势可能源于该模型的链式思维机制，该机制模仿了在复杂认知任务（如语言分析）中人类推理的结构。

发布时间: 2/5/2025

查看原文