arXiv 论文列表

作者: Maximus Powers, Hua Wei, Umang Mavani, Harshitha Reddy Jonala, Ansh Tiwari

自然语言处理 (NLP) 中的偏见检测是一个重大挑战，尤其是在大型语言模型 (LLM) 在各个领域中应用越来越广泛的背景下。本文介绍了 GUS-Net，这是一种创新的偏见检测方法，它侧重于三种主要的偏见类型： (G)eneralizations（泛化）、(U)nfairness（不公平）和 (S)tereotypes（刻板印象）。GUS-Net 利用生成式 AI 和自动化代理来创建全面的合成数据集，从而实现强大的多标签标记分类。我们的方法通过整合预训练模型的上下文编码来增强传统的偏见检测方法，从而提高识别偏见实体的准确性和深度。通过大量的实验，我们证明了 GUS-Net 优于最先进的技术，在准确率、F1 分数和汉明损失方面取得了优异的性能。研究结果突出了 GUS-Net 在跨不同语境捕获各种偏见方面的有效性，使其成为文本中社会偏见检测的宝贵工具。这项研究为 NLP 中解决隐性偏见的持续努力做出了贡献，为未来在各个领域的研究和应用提供了途径。用于创建数据集和模型的 Jupyter 笔记本可在以下网址获取：https://github.com/Ethical-Spectacle/fair-ly/tree/main/resources。警告：本文包含有害语言的示例，建议读者谨慎阅读。

发布时间: 10/14/2024

查看原文

语言模型开发者应报告训练测试重叠

作者: Andy K Zhang, Kevin Klyman, Yifan Mai, Yoav Levine, Yian Zhang, Rishi Bommasani, Percy Liang

语言模型被广泛评估，但正确解读评估结果需要了解训练-测试重叠，即语言模型在多大程度上被训练用于它正在被测试的同一数据。目前公众缺乏关于训练-测试重叠的足够信息：大多数模型没有公开的训练-测试重叠统计数据，第三方也无法直接测量训练-测试重叠，因为他们无法访问训练数据。为了明确这一点，我们记录了 30 位模型开发者的做法，发现只有 9 位开发者报告了训练-测试重叠：4 位开发者在开源许可下发布了训练数据，使社区能够直接测量训练-测试重叠，5 位开发者发布了他们的训练-测试重叠方法和统计数据。通过与语言模型开发者互动，我们为另外 3 位开发者提供了关于训练-测试重叠的新信息。总的来说，我们认为语言模型开发者应该在他们报告公共测试集上的评估结果时，发布训练-测试重叠统计数据和/或训练数据。我们希望我们的工作能够提高训练-测试重叠的透明度，从而提高社区对模型评估的信任。

发布时间: 10/14/2024

查看原文

瓶中融合：可微自适应融合 (DAM) 及从平均到自动化的路径

作者: Thomas Gauthier-Caron, Shamane Siriwardhana, Elliot Stein, Malikeh Ehghaghi, Charles Goddard, Mark McQuade, Jacob Solawetz, Maxime Labonne

通过合并模型，人工智能系统可以结合不同语言模型的独特优势，在无需大量重新训练的情况下实现多种能力的平衡。然而，由于训练方法和微调的差异，集成过程可能很复杂，通常需要专门的知识和反复改进。本文探讨了跨复杂度范围的模型合并技术，考察了进化策略等自动化方法与 DARE、TIES-Merging 等超参数驱动方法以及模型汤等更简单方法相比的表现。此外，我们还介绍了可微自适应合并 (DAM)，这是一种高效的自适应合并方法，作为进化合并的替代方案，通过缩放系数优化模型集成，最大限度地减少计算需求。我们的研究结果表明，即使是像模型汤这样的简单平均方法，在模型相似度较高的情况下也能表现出竞争力，突出了每种技术的独特优势和局限性。我们在 GitHub 上开源了 DAM，包括实现代码和实验流程：https://github.com/arcee-ai/DAM。

发布时间: 10/14/2024

查看原文

内核班扎夫：一种快速且鲁棒的班扎夫值估计器

作者: Yurong Liu, R. Teal Witter, Flip Korn, Tarfah Alrashed, Dimitris Paparas, Juliana Freire

班扎夫值作为一种简单且可解释的替代方案，为广泛使用的沙普利值提供了新的视角。我们介绍了一种名为内核班扎夫的新型算法，该算法借鉴了内核SHAP的灵感，利用了班扎夫值与线性回归之间的巧妙联系。通过对特征归因任务的广泛实验，我们证明了内核班扎夫在样本效率和对噪声的鲁棒性方面显著优于其他用于估计班扎夫值的算法。此外，我们证明了该算法性能的理论保证，将内核班扎夫确立为可解释机器学习的宝贵工具。

发布时间: 10/14/2024

查看原文

基于自然语言的强化学习策略探索儿童高效数字学习

作者: Tirthankar Mittra

本文以强化学习 (RL) 为框架，研究儿童如何学习数字，并重点关注语言指令的影响。使用强化学习的动机源于其与受控环境中的心理学习理论的相似之处。通过使用最先进的深度强化学习模型，我们模拟并分析了各种形式的语言指令对数字习得的影响。我们的研究结果表明，某些语言结构更有效地提高了 RL 智能体对数字的理解能力。此外，我们的模型预测了向 RL 智能体展示数字的最佳顺序，从而提高了它们的学习速度。这项研究为语言和数字认知之间的相互作用提供了宝贵的见解，对教育策略和旨在支持幼儿学习的人工智能系统的发展具有意义。

发布时间: 10/14/2024

查看原文

人工智能生成情感与人工评估一致性水平：一种方法论建议

作者: Miguel Carrasco, Cesar Gonzalez-Martin, Sonia Navajas-Torrente, Raul Dastres

图像能够传递情感，但情感体验高度主观。人工智能的进步使得根据情感描述生成图像成为可能。然而，生成图像与人类情感反应之间的一致性程度尚未得到评估。为了解决这个问题，使用 StyleGAN2-ADA 生成了 20 幅艺术风景画。为每幅图像创建了四种变体，分别唤起积极情绪（满足感、娱乐感）和消极情绪（恐惧、悲伤），共计 80 幅图片。使用这些材料设计了一份在线问卷，61 名观察者对生成的图像进行了分类。对收集到的数据进行了统计分析，以确定参与者之间、观察者反应之间以及 AI 生成的情绪之间的一致性水平。结果表明，总体上的一致性水平良好，负面情绪的结果更好。然而，该研究证实了情感评估中固有的主观性。

发布时间: 10/14/2024

查看原文

UNIQ：用于避免不良示范的离线逆向 Q 学习

作者: Huy Hoang, Tien Mai, Pradeep Varakantham

我们解决了一个离线学习策略以避免不良示范的问题。与旨在模仿专家或近似最优示范的传统离线模仿学习方法不同，我们的设定涉及避免不良行为（使用不良示范指定）。为了解决这个问题，与标准模仿学习的目标是最大程度地减少学习策略与专家示范之间的距离不同，我们将学习任务表述为最大化状态-动作稳态分布空间中学习策略与不良策略之间的统计距离。这种截然不同的方法导致了一个新颖的训练目标，需要一个新的算法来解决它。我们的算法 UNIQ 在逆 Q 学习框架的基础上解决了这些挑战，将学习问题构建为一个合作（非对抗性）任务。然后，我们演示了如何有效地利用未标记数据进行实际训练。我们的方法在标准基准环境中进行了评估，在该环境中，它始终优于最先进的基线。代码实现可在以下地址获取：https://github.com/hmhuy0/UNIQ。

发布时间: 10/14/2024

查看原文

循环Transformer能否学会为上下文学习实现多步梯度下降？

作者: Khashayar Gatmiry, Nikunj Saunshi, Sashank J. Reddi, Stefanie Jegelka, Sanjiv Kumar

大型语言模型（LLMs）在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别（NER）中，现有的基于 LLMs 的方法……

发布时间: 10/14/2024

查看原文

通过强化学习和合成偏好提高自动生成问题的难度

作者: William Thorne, Ambrose Robinson, Bohua Peng, Chenghua Lin, Diana Maynard

随着文化遗产领域越来越多地采用检索增强生成 (RAG) 等技术来提供更个性化的搜索体验并实现与馆藏数据的对话，对专业评估数据集的需求不断增长。虽然端到端系统测试至关重要，但评估单个组件同样重要。我们关注最终的回答任务，该任务非常适合机器阅读理解 (MRC)。尽管现有的 MRC 数据集涵盖了通用领域，但它们缺乏文化遗产信息所需的特定性。不幸的是，对于大多数遗产机构来说，手动创建此类数据集的成本过高。本文提出了一种经济高效的方法，利用来自合成偏好数据的强化学习从人类反馈 (RLHF) 生成更难的特定领域 MRC 数据集。我们的方法利用现有问答模型在 SQuAD 子集上的性能来创建难度指标，假设更具挑战性的问题被正确回答的频率较低。这项研究贡献了以下内容： (1) 使用 PPO 和合成数据提高问题难度的 методология; (2) 该方法有效性的实证证据，包括人工评估; (3) 深入的错误分析和对涌现现象的研究; (4) 开源代码库和三套 llama-2-chat 适配器，用于复现和适应。

发布时间: 10/14/2024

查看原文

融合感知：连接常识、视觉和触觉以实现鲁棒的稀疏视图重建

作者: Irving Fang, Kairui Shi, Xujin He, Siqi Tan, Yifan Wang, Hanwen Zhao, Hung-Jui Huang, Wenzhen Yuan, Chen Feng, Jing Zhang

人类能够毫不费力地将常识知识与来自视觉和触觉的感官输入相结合，以理解周围环境。为了模拟这种能力，我们引入了 FusionSense，这是一个新颖的 3D 重建框架，使机器人能够将来自基础模型的先验知识与来自视觉和触觉传感器的稀疏观测相融合。FusionSense 解决了三个关键挑战：（i）机器人如何有效地获取关于周围场景和物体的稳健全局形状信息？（ii）机器人如何使用几何和常识先验知识战略性地选择物体上的接触点？（iii）触觉信号等部分观测如何改进物体的整体表示？我们的框架采用 3D 高斯散点作为核心表示，并结合了涉及全局结构构建、物体视觉外壳修剪和局部几何约束的分层优化策略。这一进步在具有传统上具有挑战性的物体的环境中实现了快速且稳健的感知，这些物体是透明的、反射的或黑暗的，从而能够执行更多下游操作或导航任务。在真实世界数据上的实验表明，我们的框架优于以前最先进的稀疏视图方法。所有代码和数据都在项目网站上开源。

发布时间: 10/14/2024

查看原文