arXiv 论文列表

作者: Juan Pablo Mu\~noz, Jinjie Yuan, Nilesh Jain

大型预训练模型（LPM），例如大型语言模型，已变得无处不在，并被应用于许多应用场景。这些模型通常通过微调阶段被调整到所需的领域或下游任务。本文提出了一种名为 SQFT 的端到端解决方案，用于对 LPM 进行低精度稀疏参数高效微调，从而在资源受限的环境中实现有效的模型操作。此外，一种创新策略使稀疏权重能够与低秩适配器合并，而不会损失稀疏性和准确性，克服了先前方法的局限性。SQFT 还解决了具有不同数值精度的量化权重和适配器的合并挑战，使合并能够在所需的数值格式中进行，而不会牺牲准确性。多个适应场景、模型和全面的稀疏性级别证明了 SQFT 的有效性。模型和代码可在 https://github.com/IntelLabs/Hardware-Aware-Automated-Machine-Learning 上获取。

发布时间: 10/8/2024

查看原文

面向6G无线接入网的分布式人工智能平台

作者: Ganesh Ananthanarayanan, Xenofon Foukas, Bozidar Radunovic, Yongguang Zhang

蜂窝无线接入网 (RAN) 正在快速向 6G 发展，这是由运营商和企业降低成本和引入新的收入来源的需求驱动的。在这种情况下，AI 成为解决涵盖管理和应用领域的复杂 RAN 问题的关键推动力量。不幸的是，尽管 AI 拥有不可否认的潜力，但仍然存在一些实际挑战，阻碍了 AI 应用在 RAN 领域的广泛应用。本文试图阐明这些挑战，并认为现有的解决方法不足以实现真正 AI 原生的 6G 网络的愿景。受缺乏解决方案的推动，本文提出了一种通用的分布式 AI 平台架构，该架构针对 AI 原生 RAN 的需求量身定制，并讨论了其与正在进行的标准化工作的一致性。

发布时间: 10/8/2024

查看原文

通过选择性参数合并缓解大型语言模型微调中的训练不平衡问题

作者: Yiming Ju, Ziyi Ni, Xingrun Xing, Zhixiong Zeng, hanyu Zhao, Siqi Fan, Zheng Zhang

监督微调（SFT）对于将大型语言模型（LLMs）适应特定任务至关重要。这项工作表明，训练数据的顺序会导致显著的训练不平衡，可能导致性能下降。因此，我们提出通过合并使用不同数据顺序进行微调的 SFT 模型来缓解这种不平衡，从而提高 SFT 的整体有效性。此外，我们引入了一种新技术，“参数选择合并”，它在五个数据集上优于传统的加权平均方法。此外，通过分析和消融研究，我们验证了该方法的有效性，并确定了性能提升的来源。

发布时间: 10/8/2024

查看原文

超越标量奖励模型：从偏好数据中学习生成性评判者

作者: Ziyi Ye, Xiangsheng Li, Qiuchi Li, Qingyao Ai, Yujia Zhou, Wei Shen, Dong Yan, Yiqun Liu

从偏好反馈中学习是使大型语言模型 (LLM) 与人类价值观保持一致的一种常见做法。传统上，偏好数据被学习并编码成一个标量奖励模型，该模型将价值头连接到 LLM 以生成一个标量分数作为偏好或奖励。然而，标量模型缺乏可解释性，并且众所周知易受数据集中的偏差影响。本文研究利用 LLM 的生成能力来一举解决这两个局限性。具体来说，我们提示预训练的 LLM 生成正面和负面判断，两者都以自然语言形式提供理由支持。自我生成的对比判断对被用于使用直接偏好优化 (DPO) 训练生成性评判。这种使用自我生成的对比判断 (Con-J) 训练生成性评判的提议确保了自然可解释性，因为生成的理由与判断一起，以及在不需要额外奖励头的情况下对偏差的高度鲁棒性。实验结果表明，Con-J 的性能与在相同偏好数据集中训练的标量奖励模型相当，并证明了其在编码人类偏好方面的优越可解释性和鲁棒性。

发布时间: 10/8/2024

查看原文

走向亚专科医疗专业知识的民主化

作者: Jack W. O'Sullivan, Anil Palepu, Khaled Saab, Wei-Hung Weng, Yong Cheng, Emily Chu, Yaanik Desai, Aly Elezaby, Daniel Seung Kim, Roy Lan, Wilson Tang, Natalie Tapaskar, Victoria Parikh, Sneha S. Jain, Kavita Kulkarni, Philip Mansfield, Dale Webster, Juraj Gottweis, Joelle Barral, Mike Schaekermann, Ryutaro Tanno, S. Sara Mahdavi, Vivek Natarajan, Alan Karthikesalingam, Euan Ashley, Tao Tu

医疗领域中，特别是罕见、复杂和危及生命的疾病，缺乏亚专科医师的专业知识给医疗服务带来了重大挑战。这个问题在心脏病学领域尤为突出，因为及时、准确的管理决定着预后。我们探索了 AMIE（Articulate Medical Intelligence Explorer）的潜力，它是一个基于大型语言模型（LLM）的实验性人工智能系统，针对诊断对话进行了优化，旨在在这个充满挑战的背景下增强和支持临床决策。我们从一个亚专科心脏病学实践中收集了一个包含 204 个复杂病例的真实世界数据集，其中包括心电图、超声心动图、心脏 MRI、基因检测和心肺压力测试的结果。我们开发了一个十个领域评估指标，由亚专科医师使用该指标评估由普通心脏病学家或 AMIE 生成的诊断和临床管理计划的质量，后者增强了网络搜索和自我批评功能。在 10 个领域中的 5 个领域，AMIE 被评为优于普通心脏病学家（偏好范围从 9% 到 20%），其余领域则与之相当。访问 AMIE 的响应提高了心脏病学家在 63.7% 的病例中的总体响应质量，而降低了 3.4% 的质量。在所有 10 个领域中，有权访问 AMIE 的心脏病学家的响应优于没有权访问 AMIE 的心脏病学家响应。定性检查表明，AMIE 和普通心脏病学家可以相互补充，AMIE 彻底而敏感，而普通心脏病学家简洁而具体。总的来说，我们的结果表明，专门的医疗 LLM 有可能通过弥合亚专科专业知识的差距来增强普通心脏病学家的能力，尽管进一步的研究和验证对于广泛的临床应用至关重要。

发布时间: 10/8/2024

查看原文

从视觉、语音和文本中进行语法推断

作者: Yu Zhao, Hao Fei, Shengqiong Wu, Meishan Zhang, Min Zhang, Tat-seng Chua

语法归纳可以从丰富的异构信号中获益，例如文本、视觉和声学。在此过程中，来自不同模态的特征本质上相互补充。基于这种直觉，本工作引入了一种新颖的**无监督视觉-音频-文本语法归纳**任务（称为**VAT-GI**），从平行图像、文本和语音输入中推断出成分语法树。受语言语法天生存在于文本之外的事实启发，我们认为文本不应成为语法归纳中的主要模态。因此，我们进一步引入了 VAT-GI 的**无文本**设置，其中任务仅依赖于视觉和听觉输入。为了解决该任务，我们提出了一种视觉-音频-文本内部-外部递归自动编码器（**VaTiora**）框架，该框架利用丰富的模态特定特征和互补特征来有效地进行语法解析。此外，还构建了一个更具挑战性的基准数据集来评估 VAT-GI 系统的泛化能力。在两个基准数据集上的实验表明，我们提出的 VaTiora 系统在整合各种多模态信号方面更加有效，并且在 VAT-GI 方面也展现出新的最先进性能。

发布时间: 10/8/2024

查看原文

ERASMO：利用大型语言模型进行增强型聚类分割

作者: Fillipe dos Santos Silva, Gabriel Kenzo Kakimoto, Julio Cesar dos Reis, Marcelo S. Reis

聚类分析在各种领域和应用中发挥着至关重要的作用，例如营销中的客户细分。这些环境通常涉及多模态数据，包括表格和文本数据集，这使得代表隐藏模式以获得有意义的聚类变得具有挑战性。本研究介绍了 ERASMO，这是一个旨在对文本编码的表格数据进行微调预训练语言模型并从微调模型生成嵌入的框架。ERASMO 采用文本转换器将表格数据转换为文本格式，使语言模型能够更有效地处理和理解数据。此外，ERASMO 通过随机特征序列混洗和数字语言化等技术生成上下文丰富且结构代表性的嵌入。使用多个数据集和基线方法进行了广泛的实验评估。我们的结果表明，ERASMO 充分利用了每个表格数据集的特定上下文，从而为准确的聚类生成更精确和细致的嵌入。这种方法通过捕获不同表格数据中的复杂关系模式来增强聚类性能。

发布时间: 10/8/2024

查看原文

面向 O-RAN 的自适应资源优化元强化学习方法

作者: Fatemeh Lotfi, Fatemeh Afghah

随着无线网络不断发展以支持更复杂的应用，开放无线接入网（O-RAN）架构及其智能RAN智能控制器（RIC）模块成为实时网络数据收集、分析和动态管理网络资源（包括无线资源块和下行链路功率分配）的关键解决方案。利用人工智能（AI）和机器学习（ML），O-RAN 以前所未有的效率和适应性满足了现代网络的可变需求。尽管在使用基于ML的策略进行网络优化方面取得了进展，但在不可预测的环境中动态分配资源方面仍然存在挑战。本文提出了一种新颖的元深度强化学习（Meta-DRL）策略，其灵感来自模型无关元学习（MAML），以推进O-RAN中的资源块和下行链路功率分配。我们的方法利用O-RAN的解耦架构，结合虚拟分布式单元（DU）和元-DRL策略，实现自适应和本地化决策，显著提高网络效率。通过集成元学习，我们的系统可以快速适应新的网络条件，实时优化资源分配。这使得网络管理性能比传统方法提高了19.8%，提升了下一代无线网络的能力。

发布时间: 10/8/2024

查看原文

CliMB：临床预测建模的 AI 赋能伙伴

作者: Evgeny Saveliev, Tim Schubert, Thomas Pouplin, Vasilis Kosmoliaptsis, Mihaela van der Schaar

尽管人工智能（AI）具有巨大的潜力和持续的技术进步，但其在现实世界中的应用仍然有限。我们将其归因于“领域专家-AI-困境”：虽然领域专家，例如临床科学家，应该能够构建诸如风险评分之类的预测模型，但他们面临着获取最先进（SOTA）工具的重大障碍。虽然自动化机器学习 (AutoML) 被提议作为临床预测建模的合作伙伴，但要使机器学习对临床科学家来说易于访问，还需要满足许多额外要求。为了解决这一差距，我们推出了 CliMB，一个无代码 AI 驱动的合作伙伴，旨在赋予临床科学家使用自然语言创建预测模型的能力。CliMB 指导临床科学家完成整个医疗数据科学流程，从而使他们能够仅通过一次对话从现实世界数据中创建预测模型。CliMB 还创建结构化报告和可解释的视觉效果。在涉及临床科学家和与基线 GPT-4 进行系统比较的评估中，CliMB 在规划、错误预防、代码执行和模型性能等关键领域始终表现出优异的性能。此外，在涉及 45 位来自不同专业和职业阶段的临床医生的盲测评估中，超过 80% 的人更喜欢 CliMB 而不是 GPT-4。总的来说，通过提供一个无代码界面，并提供清晰的指导以及对数据中心 AI、AutoML 和可解释 ML 领域的 SOTA 方法的访问，CliMB 使临床科学家能够构建强大的预测模型。

发布时间: 10/8/2024

查看原文

评估 AI 导演对任务选择的影響

作者: Kristen K. Yu, Matthew Guzdial, Nathan Sturtevant

现代商业游戏的设计目标是大众吸引力，而非针对单个玩家，然而，在视频游戏中，通过调整游戏元素来更好地契合个人，存在着独特的机遇。本文关注 AI 导演，即能够动态修改游戏的系统，以个性化玩家体验，使其与玩家的偏好相匹配。过去，一些 AI 导演研究得出的结果并不确定，因此它们对玩家体验的影响尚不明确。我们选取了三个 AI 导演，并在人类受试者研究中直接比较它们，以测试它们在任务选择方面的有效性。我们的结果表明，非随机 AI 导演比随机 AI 导演能够提供更好的玩家体验。

发布时间: 10/8/2024

查看原文