arXiv 论文列表

作者: Junyu Luo, Yiyang Gu, Xiao Luo, Wei Ju, Zhiping Xiao, Yusheng Zhao, Jingyang Yuan, Ming Zhang

无源域自适应是一个重要的机器学习课题，因为它在现实世界中有着广泛的应用，尤其是在数据隐私方面。现有的方法主要关注欧几里德数据，例如图像和视频，而对非欧几里德图数据的探索仍然很少。在无源自适应场景中，最近的图神经网络 (GNN) 方法由于域偏移和标签稀缺而可能导致性能严重下降。在本研究中，我们提出了一种名为基于图扩散的对齐拼图 (GALA) 的新方法，专门用于无源图域自适应。为了实现域对齐，GALA 采用图扩散模型从目标数据重建源样式图。具体来说，使用源图训练基于分数的图扩散模型来学习生成性源样式。然后，我们通过随机微分方程而不是从先验样本中对目标图进行扰动，然后进行反向过程以重建源样式图。我们将源样式图输入现成的 GNN，并结合课程学习引入特定于类的阈值，这可以为目标图生成准确且无偏差的伪标签。此外，我们开发了一种简单而有效的图混合策略，称为图拼图，以结合置信图和非置信图，这可以通过一致性学习来增强泛化能力和鲁棒性。在基准数据集上的大量实验验证了 GALA 的有效性。

发布时间: 10/23/2024

查看原文

凸马尔可夫博弈：多智能体学习中公平性、模仿和创造性的框架

作者: Ian Gemp, Andreas Haupt, Luke Marris, Siqi Liu, Georgios Piliouras

专家模仿、行为多样性和公平偏好导致了序贯决策领域中无法随时间累加分解的偏好。我们引入了凸马尔可夫博弈这一类别，它允许对占用测度进行一般的凸偏好。尽管具有无限时间范围并且严格比马尔可夫博弈更具一般性，但在严格凸性的条件下，纯策略纳什均衡依然存在。此外，可以通过对可利用性的上限进行梯度下降来有效地逼近均衡。我们的实验模仿了人类在终极博弈中的选择，揭示了重复囚徒困境的新颖解，并在重复非对称协调博弈中找到了公平解。在囚徒困境中，我们的算法找到的策略组合与观察到的人类行为只有细微的偏差，但却实现了更高的玩家效用，同时可利用性也降低了三个数量级。

发布时间: 10/23/2024

查看原文

同质图上可扩展且表达能力强的图神经网络的图采样

作者: Haolin Li, Luana Ruiz

图神经网络 (GNN) 在许多图机器学习任务中表现出色，但在扩展到大型网络时面临挑战。GNN的可迁移性允许在较小的图上进行训练并将模型应用于较大的图，但现有方法通常依赖于随机子采样，这会导致子图断开连接并降低模型的表达能力。我们提出了一种新颖的图采样算法，该算法利用特征同质性来保留图结构。通过最小化数据相关矩阵的迹，我们的方法比随机采样更好地保留了图拉普拉斯算子的秩，同时实现了比谱方法更低的复杂度。在引文网络上的实验表明，与随机采样相比，该方法在保留图秩和GNN可迁移性方面具有更好的性能。

发布时间: 10/23/2024

查看原文

基于大语言模型的动态自适应秩空间探索高效情感分析方法

作者: Hongcheng Ding, Fuzhen Hu, Xuanze Zhao, Zixiao Jiang, Shamsul Nahar Abdullah, Deshinta Arrova Dewi

情感分析在评估公众舆论和辅助决策方面变得越来越重要。大型语言模型 (LLM) 通过捕捉细微的语言模式彻底改变了这一领域。然而，由于计算限制和对最佳微调的需求，将 LLM 应用于特定领域的情感分析任务仍然具有挑战性。为了应对这些挑战，我们提出了一种新颖的动态自适应秩空间探索 (DARSE) 框架，用于利用 LLM 进行高效有效的情感分析。DARSE 包含一个粗粒度的贪婪算法来识别最佳秩范围，一个细粒度的探索算法来细化秩选择，以及一个动态秩分配方法来确定每个 LLM 层的最佳秩组合。大量的实验表明，DARSE 显著提高了情感分析的准确性，与之前的工作相比，均方误差 (MSE) 提高了 15.1%，准确率提高了 4.3%。我们的框架在计算效率和模型性能之间取得了平衡，使其成为一种很有前景的利用 LLM 进行情感分析的方法。

发布时间: 10/23/2024

查看原文

对抗训练中的冲突感知

作者: Zhiyu Xue, Haohan Wang, Yao Qin, Ramtin Pedarsani

对抗训练是通过直接在训练过程中加入对抗样本，来获得深度神经网络对抗鲁棒性的最有效方法。为了获得准确且鲁棒的模型，加权平均法被用来同时优化标准损失和对抗损失。本文认为，加权平均法并没有为标准性能和对抗鲁棒性提供最佳的权衡。我们认为，加权平均法的失败是由于标准损失和对抗损失导出的梯度之间存在冲突，并进一步从理论和实践上证明了这种冲突会随着攻击预算的增加而加剧。为了缓解这个问题，我们提出了一种新的对抗训练权衡范式，该范式针对标准损失和对抗损失的凸组合使用了一个冲突感知因子，命名为**冲突感知对抗训练 (CA-AT)**。全面的实验结果表明，在从零开始的对抗训练和参数高效微调的设置下，CA-AT始终在标准性能和对抗鲁棒性之间提供了更好的权衡。

发布时间: 10/23/2024

查看原文

隐式接触扩散器：基于潜在点云扩散的顺序接触推理

作者: Zixuan Huang, Yinong He, Yating Lin, Dmitry Berenson

长期以来，长时序、高接触交互的操作一直是一个难题，因为它需要同时推理离散的接触模式和连续的物体运动。我们引入了隐式接触扩散器（ICD），这是一个基于扩散的模型，它生成一系列神经描述符，这些描述符指定了物体与环境之间的一系列接触关系。然后，将此序列用作MPC方法的指导，以完成给定的任务。这种方法的主要优势在于，潜在描述符为MPC提供了更多与任务相关的指导，有助于避免高接触交互操作任务的局部最小值。我们的实验表明，ICD在复杂的、长时序的、高接触交互操作任务（例如电缆布线和笔记本电脑折叠）上优于基线方法。此外，我们的实验还表明，该方法可以将目标接触关系推广到不同的环境。更多可视化结果可在我们的网站上找到：[https://implicit-contact-diffuser.github.io/](https://implicit-contact-diffuser.github.io)

发布时间: 10/23/2024

查看原文

提高赌注：绩效压力提升AI辅助决策

作者: Nikita Haduong (Paul G. Allen School of Computer Science & Engineering, University of Washington), Noah A. Smith (Paul G. Allen School of Computer Science & Engineering, University of Washington, Allen Institute for Artificial Intelligence)

大型语言模型已在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别 (NER) 中，现有的基于大型语言模型的方法…… 人工智能系统被广泛应用于辅助决策，尽管人工智能系统辅助决策的潜力已被广泛讨论，但人机协作的绩效往往低于预期。对未能实现其性能潜力的原因的调查揭示了许多因素，包括对人工智能系统的（误）信任以及对主观任务中人工智能能力的心智模型。众所周知，绩效压力会影响人类的决策行为，但其与人机决策的相互作用却鲜有研究。在这项工作中，我们展示了绩效压力对人工智能建议依赖性的影响，参与者是外行人（亚马逊 Mechanical Turk 众包工人），他们完成一项常见的人工智能辅助任务（虚假评论检测），因此其固有的绩效压力较低。我们通过利用人们在完成任务时对潜在金钱收益的损失厌恶来操纵绩效压力。我们发现，当风险较高时，人们比风险较低时更恰当地使用人工智能建议，无论是否存在人工智能解释。此外，当人工智能系统给出错误建议时，当风险较高时，人们比风险较低时更经常正确地忽略这些糟糕的建议。最后，我们讨论了绩效压力如何影响人工智能辅助决策的影响，并鼓励未来的研究纳入绩效压力分析。

发布时间: 10/23/2024

查看原文

PromptHive：通过协作式提示工程将学科专家重新置于教育内容创作的最前沿

作者: Mohi Reza, Ioannis Anastasopoulos, Shreya Bhandari, Zachary A. Pardos

在许多自然语言处理任务中，大型语言模型 (LLM) 已取代传统方法。然而，在命名实体识别 (NER) 中，现有的基于 LLM 的方法…… (如果原文只有这一句，则翻译如上；若原文包含更多内容，则翻译如下) 将领域专家纳入提示工程能够引导大型语言模型 (LLM) 输出更有帮助、更准确、更符合不同领域多样化需求的内容。然而，如果没有足够的界面支持来进行特定任务环境下的系统性实验，迭代以获得有效的提示可能具有挑战性。在这项工作中，我们介绍了 PromptHive，这是一个用于提示创作的协作界面，旨在通过鼓励快速迭代提示变体的功能，更好地将领域知识与提示工程联系起来。我们对十位数学领域专家进行了一项评估研究，并通过两次协作提示写作会议和一项对 358 名学习者的学习成果研究来验证我们的设计。我们的结果阐明了提示迭代过程，并验证了该工具的可用性，使非人工智能专家能够创建生成内容与人工编写的材料相当的提示，同时将感知到的认知负荷减少一半，并将创作过程从几个月缩短到几个小时。

发布时间: 10/23/2024

查看原文

链式思维的理论理解：连贯推理与错误感知演示

作者: Yingqian Cui, Pengfei He, Xianfeng Tang, Qi He, Chen Luo, Jiliang Tang, Yue Xing

少样本链式思维（CoT）提示已在提高大型语言模型（LLM）的推理能力方面展现出强大的性能。虽然已经进行了理论研究来理解CoT，但这些研究中使用的底层Transformer将CoT推理过程隔离到分离的上下文学习步骤（逐步ICL）中。在这项工作中，我们从理论上证明，与逐步ICL相比，如果将早期步骤的推理（连贯CoT）整合起来，Transformer将获得更好的纠错能力和更准确的预测。鉴于这种连贯的推理会改变Transformer的行为，我们进一步研究了在推理阶段演示示例被破坏时，具有连贯CoT的Transformer的敏感性。我们的理论结果表明，Transformer对中间推理步骤中的错误比对最终结果更敏感。基于这一观察结果，我们通过在演示中结合正确和错误的推理路径来改进CoT。我们的实验验证了所提出方法的有效性。

发布时间: 10/23/2024

查看原文

贝叶斯上下文学习的缩放律

作者: Aryaman Arora, Dan Jurafsky, Christopher Potts, Noah D. Goodman

少样本学习（ICL）是一种强大的技术，无需训练更新即可使语言模型执行复杂任务。先前的工作已经确定了提供的上下文示例数量与模型预测准确性之间存在很强的相关性。本文试图通过证明ICL近似于贝叶斯学习器来解释这种相关性。这种观点产生了一系列用于ICL的新型贝叶斯缩放定律。在使用不同大小的GPT-2模型进行的实验中，我们的缩放定律在准确性方面超过或匹配现有缩放定律，同时还为任务先验、学习效率和每个示例的概率提供了可解释的项。为了说明这种可解释的缩放定律所提供的分析能力，我们报告了旨在为现实世界安全对齐研究提供信息的受控合成数据集实验。在我们的实验方案中，我们使用SFT抑制不需要的现有模型能力，然后使用ICL尝试恢复该能力（多样本越狱）。然后，我们使用能力基准以及新的多样本越狱数据集对现实世界指令微调的LLM进行实验。在所有情况下，贝叶斯缩放定律都能准确预测ICL导致被抑制行为重新出现的条件，这揭示了训练后提高LLM安全性的无效性。

发布时间: 10/23/2024

查看原文