arXiv 论文列表

人人可用的大型语言模型：为大型语言模型中的弱势群体发声

自然语言处理（NLP）领域见证了大型语言模型（LLMs）在众多任务中的显著影响。然而，LLMs在多语言环境中的局限性，特别是在代表性不足的语言中，仍然是一个重大障碍。本论文旨在通过聚焦于代表性不足的语言来弥合NLP研究和开发中的差距。对LLMs进行了全面评估，以评估其在这些语言中的能力，揭示了多语言和多文化泛化的挑战。针对多语言泛化差距，本论文提出了数据和计算高效的方法，以缓解LLMs在代表性不足语言中的能力差异，从而在不损失任务泛化能力的情况下更好地泛化代表性不足的语言。所提出的解决方案包括跨语言持续指令调优、基于检索的跨语言上下文学习以及上下文查询对齐。此外，提出了一种新颖的方法来衡量在不同语言中运行的LLMs之间的文化价值观对齐，确保文化敏感性和包容性。这些贡献旨在增强LLMs在代表性不足语言中的多语言和多文化对齐，最终推动NLP领域朝着更大的平等和包容性发展。

发布时间: 9/24/2024

查看原文

基于直观物理先验的学习玩视频游戏

arXiv:2409.13886v1 公告类型: 交叉摘要: 电子游戏是一个高度结构化的领域，算法决策可以在没有现实世界负面后果的情况下进行测试。虽然主流方法依赖于图像输入以避免手工构建状态空间表示的问题，但这种方法系统性地偏离了人类实际学习玩游戏的方式。在本文中，我们设计了基于对象的输入表示，这些表示在多个视频游戏中具有良好的泛化能力。利用这些表示，我们评估了一个代理在有限世界经验下学习类似婴儿的游戏的能力，采用简单的归纳偏差，这些偏差源自现实世界物理的直观表示。利用这些偏差，我们构建了一个对象类别表示，供Q学习算法使用，并评估其基于观察到的对象功能学习玩多个游戏的效果。我们的结果表明，类似人类的物体交互设置能够学习玩多个视频游戏，并展示了优越的泛化能力，特别是在处理不熟悉的物体时。进一步探索这些方法将使机器能够以人类为中心的方式学习，从而纳入更多的人类学习优势。

发布时间: 9/24/2024

查看原文

多语言模型去偏框架

arXiv:2409.13884v1 公告类型: 交叉摘要: 大型语言模型 (LLMs) 是具有巨大潜力造福社会的强大工具，然而，它们也表现出加剧社会不平等的偏见。尽管在数据增强、零样本提示和模型微调等方面取得了显著的偏见缓解技术进展，但偏见仍然持续存在，包括那些可能逃过人类检测的微妙偏见。最近的研究表明，人们对多LLM方法的兴趣日益增长，这些方法已被证明在提高LLM的推理质量和事实性方面是有效的。基于这一方法，我们提出了一种新颖的多LLM去偏框架，旨在减少LLM中的偏见。我们的工作首次引入并评估了该框架内的两种不同去偏方法：集中式方法，其中对话由单一的中央LLM协调，以及分散式方法，其中所有模型直接通信。我们的研究结果表明，我们的多LLM框架显著减少了LLM中的偏见，在多个社会群体中优于基线方法。

发布时间: 9/24/2024

查看原文

使用二元扩散生成表格数据

arXiv:2409.13882v1 公告类型: 交叉摘要: 生成合成表格数据在机器学习中至关重要，尤其是在真实数据有限或敏感的情况下。传统的生成模型由于表格数据的独特特性，如混合数据类型和分布多样性，常常面临挑战，并且需要复杂的预处理或大型预训练模型。本文介绍了一种新颖的无损二进制转换方法，将任何表格数据转换为固定大小的二进制表示，并引入了一种名为二进制扩散的新生成模型，专门设计用于二进制数据。二进制扩散利用XOR操作的简单性进行噪声添加和去除，并采用二进制交叉熵损失进行训练。我们的方法消除了对广泛预处理、复杂噪声参数调整和大型数据集预训练的需求。我们在多个流行的表格基准数据集上评估了我们的模型，结果表明，二进制扩散在Travel、Adult Income和Diabetes数据集上优于现有的最先进模型，同时模型尺寸显著更小。

发布时间: 9/24/2024

查看原文

古希腊纸草学与铭文学中预训练因果语言模型的指令微调

本文介绍了一项实验，旨在通过微调预训练的因果语言模型（Meta的Llama 3.1 8B Instruct）来辅助语文学研究的三个基本任务：古希腊铭文和文献纸莎草的年代和地理归属以及文本修复。采用基于提示的指导方法，微调后的模型在关键指标上超越了现有技术水平。对于铭文，模型实现了更低的平均字符错误率（CER），达到22.5%（相比26.3%），同时在最多10个字符的序列中，与最高准确率（60.9% vs. 61.8%）和前20准确率（77.5% vs. 78.3%）相当。它们还通过在重建过程中忽略空格，更好地与古代书写文物中常用的连续书写方式相匹配，提供了实际优势。在地理归属方面，模型在最高准确率（75.0% vs. 70.8%）和前三准确率（83.7% vs. 82.1%）上超越了以往基准。在年代归属方面，模型实现了平均偏差26.2年（相比29.3年）和中位偏差1年（相比3年）。模型还为文献纸莎草设定了新的基准，文本重建的CER为16.3%，最高准确率为71.3%，前20准确率为85.0%；地理归属的最高准确率为66.4%，前三准确率为79.9%；年代归属的偏差为21.7年，中位偏差为0年。

发布时间: 9/24/2024

查看原文

MAGICS：基于隐式评论家斯塔克尔伯格的极大极小演员对抗强化学习，用于机器人安全收敛神经合成

arXiv:2409.13867v1 公告类型: 交叉摘要: 尽管鲁棒最优控制理论提供了一个严格的框架来计算可证明安全的机器人控制策略，但它难以扩展到高维问题，导致深度学习在机器人安全合成中的应用增加。不幸的是，现有的神经安全合成方法往往缺乏收敛性保证和解决方案的可解释性。本文提出了一种名为隐式评论家引导的极大极小演员堆叠伯格（MAGICS）的新型对抗强化学习（RL）算法，该算法保证了局部收敛到极大极小均衡解。在此基础上，我们进一步为基于深度RL的机器人安全合成算法提供了局部收敛性保证。通过在OpenAI Gym环境中的仿真研究和与36维四足机器人的硬件实验，我们展示了MAGICS能够生成优于现有最先进神经安全合成方法的鲁棒控制策略。

发布时间: 9/24/2024

查看原文

虫洞：协同演化序列的概念感知深度表示学习

arXiv:2409.13857v1 公告类型: 交叉摘要: 识别和理解共演序列中的动态概念对于分析复杂系统（如物联网应用、金融市场和在线活动日志）至关重要。这些概念提供了对序列数据底层结构和行为的宝贵见解，从而实现更好的决策和预测。本文介绍了Wormhole，一种新颖的深度表示学习框架，专为共演时间序列设计，具有概念感知能力。我们的模型通过自表示层和时间平滑性约束来确保动态概念及其转换的稳健识别。此外，通过识别潜在空间中的突变来检测概念转换，这标志着行为转变，类似于穿越虫洞。这种新颖的机制能够准确识别共演序列中的概念，并精确定位这些虫洞的位置，增强了学习表示的可解释性。实验表明，该方法能够有效地将时间序列数据分割成有意义的概念，为分析复杂的时间模式和推进概念漂移检测提供了宝贵的工具。

发布时间: 9/24/2024

查看原文

感知器的更多考量

本文介绍了一种改进的传统感知器——门控感知器，它通过引入现有输入的乘积作为额外输入，从而捕捉特征间的非线性交互，显著提升了其在复杂数据集上的分类和回归能力。我们探讨了其在鸢尾花数据集上的线性和非线性回归任务，以及PIMA印度数据集和威斯康星乳腺癌数据集上的二分类和多分类问题。结果表明，门控感知器相比传统感知器能生成更明显的决策区域，尤其在处理非线性数据时，其分类能力得到增强。性能对比显示，门控感知器在保持简单架构的同时，与最先进的分类器相媲美。

发布时间: 9/24/2024

查看原文

动态软提示在大语言模型中解锁记忆机制

预训练的大型语言模型（LLMs）已经彻底改变了自然语言处理（NLP）任务，如摘要、问答和翻译。然而，由于LLMs倾向于记忆训练数据，这导致了潜在的隐私泄露和版权侵犯，从而带来了显著的安全风险。准确测量这种记忆化对于评估和减轻这些潜在风险至关重要。然而，先前尝试描述记忆化的方法要么仅使用前缀，要么通过在前面添加一个恒定的软提示来限制前缀的使用，这些方法无法对输入的变化做出反应。为了应对这一挑战，我们提出了一种使用动态、前缀依赖的软提示来估计LLM记忆化的新方法。我们的方法涉及训练一个基于transformer的生成器，以生成适应输入变化的软提示，从而实现更准确地提取记忆数据。我们的方法不仅解决了先前方法的局限性，而且在与最先进技术的比较中，在多种实验设置下展示了优越的性能。特别是，我们的方法在文本生成任务和代码生成任务中，相对于普通基线，分别可以实现112.75%和32.26%的最大相对改进。

发布时间: 9/24/2024

查看原文

语言模型是否言行一致？探究语言模型中关于性别语言改革的语言意识形态

我们通过一个关于英语性别语言改革的案例研究（涉及诸如congressperson/-woman/-man和singular they等角色名词），研究了LLMs生成的文本中的语言意识形态。首先，我们发现政治偏见：当被要求使用“正确”或“自然”的语言时，LLMs使用的语言与被要求与保守（而非进步）价值观保持一致时最为相似。这表明，即使在看似非政治性的情境中，LLMs的元语言偏好也能隐含地传达特定政治群体的语言意识形态。其次，我们发现LLMs表现出内部不一致性：当提供更明确的元语言上下文时，LLMs更频繁地使用性别中性变体。这表明，LLMs生成的文本中表达的语言意识形态可能会有所变化，这可能是用户未曾预料到的。我们讨论了这些发现对价值对齐的更广泛影响。

发布时间: 9/24/2024

查看原文