arXiv 论文列表

谁拥有输出？在大规模语言模型 attribution 中法律与技术的桥梁

作者: Emanuele Mezzi, Asimina Mertzani, Michael P. Manis, Siyanna Lilova, Nicholas Vadivoulis, Stamatis Gatirdakis, Styliani Roussou, Rodayna Hmede

arXiv:2504.01032v1 交叉类型: cross 摘要：自2022年推出ChatGPT以来，大型语言模型（LLMs）和大型多模态模型（LMMs）已经改变了内容创作，它们能够生成高质量的人类级内容，涵盖所有媒介，包括文本、图像、视频和音频。生成人工智能模型提供的机会是无限的，极大地缩短了生成内容所需的时间，通常提高了生成的质量。然而，考虑到生成内容的复杂性和难以追踪性，使用这些工具在归因AI生成内容方面提供了挑战。归因的困难源于多个原因，从生成内容缺乏系统的指纹标识到最后一种，即LLMs和LMMs训练数据的巨大数量，这使得将生成内容与训练数据联系起来变得困难。这种情景引发了对知识产权和道德责任的担忧。为了解决这些问题，在本文中，我们通过提出目前可用的立法和技术工具的审查，并提出一个确保问责的法律框架，将技术和法律方面结合起来。最终，我们提出了三种这可以结合使用的方法，以确保归因得以尊重。尽管当今可用的技术可以在很大程度上确保更广泛的归因，但仍然存在强大的限制，这些限制只能通过开发适用于LLMs和LMMs的新归因技术来解决。

发布时间: 4/3/2025

查看原文

当AI失败时，谁该负责？映射AI隐私和伦理事件的原因、实体和后果

作者: Hilda Hadan, Reza Hadi Mogavi, Leah Zhang-Kennedy, Lennart E. Nacke

arXiv:2504.01029v1 政策类型: 横向交叉摘要：人工智能（AI）技术的快速发展已经改变了许多领域的决策方式，但同时也引发了重大的隐私和伦理问题。然而，许多针对学术界、企业和政府的AI事件分类和指南缺乏基于真实事件的根基。我们分析了202起真实的AI隐私和伦理事件，产生了跨越AI生命周期阶段的事件分类体系。该分类体系考虑了诸如原因、责任实体、披露来源和影响等背景因素。我们的研究发现，AI开发者和用户报告事件不足。许多事件是由组织决策不当和法律不符合引起的。当前仅有很少的法律行动和纠正措施，而风险缓解努力有限。我们的分类体系为未来的AI事件报告提供了一种结构化的方法。我们的研究显示，当前的AI治理框架是不充分的。我们迫切需要针对儿童的专门保护措施和社交媒体上的AI政策，以调节和减少有害AI生成内容的传播。我们的研究为政策制定者和实践者提供了见解，帮助他们设计伦理AI。它还支持AI事件检测和风险管理。最后，它指导AI政策的制定。改进后的政策将保护人们免受有害AI应用的影响，并支持AI系统的创新。

发布时间: 4/3/2025

查看原文

将多模态数据与混合图卷积和变压器网络结合进行肺动脉高压诊断

作者: Fubao Zhu, Yang Zhang, Gengmin Liang, Jiaofen Nan, Yanting Li, Chuang Han, Danyang Sun, Zhiguo Wang, Chen Zhao, Wenxuan Zhou, Jian He, Yi Xu, Iokfai Cheang, Xu Zhu, Yanli Zhou, Weihua Zhou

arXiv:2504.01025v1 类别：交叉学科摘要：早期和准确诊断肺动脉高压（PH）对于最佳患者管理至关重要。区分前肺动脉高压和后肺动脉高压对于指导治疗决策至关重要。本研究开发并验证了一种基于深度学习的诊断模型，旨在将患者分类为非PH、前肺动脉高压或后肺动脉高压。该回顾性研究分析了南京医科大学第一附属医院204名患者的资料（112名前肺动脉高压患者，32名后肺动脉高压患者，60名非PH对照组）。确诊通过右心导管检查。我们从每个类别中选择了6个样本作为测试集（18个样本，占10%），其余186个样本用于训练集。这一过程进行了35次测试。本文提出了一种结合图卷积网络（GCN）、卷积神经网络（CNN）和Transformer的深度学习模型。该模型旨在处理多模态数据，包括短轴（SAX）序列、四腔（4CH）序列和临床参数。我们的模型在测试集上的性能如下：曲线下面积（AUC）= 0.81 ± 0.06（标准差），准确率（ACC）= 0.73 ± 0.06。鉴别能力如下：非PH患者（AUC = 0.74 ± 0.11）、前肺动脉高压（AUC = 0.86 ± 0.06）、后肺动脉高压（AUC = 0.83 ± 0.10）。该模型有可能通过有效整合多模态数据来支持临床决策，帮助医生进行准确及时的诊断。

发布时间: 4/3/2025

查看原文

基于凝视引导的3D手部运动预测以检测主观中心抓取任务中的意图

作者: Yufei He, Xucong Zhang, Arno H. A. Stienen

arXiv:2504.01024v1 声明类型: cross 摘要：在神经康复应用中，通过手部运动预测来检测人类意图对于驱动上肢辅助机器人至关重要。然而，传统的依赖生理信号测量的方法受到限制，往往缺乏环境背景。我们提出了一种新的方法，用于预测未来的手部姿态和关节位置序列。该方法结合了注视信息、历史手部运动序列和环境物体数据，能够动态适应患者的辅助需求，无需事先知道抓取对象的意图。具体而言，我们使用向量量化变分自编码器进行稳健的手部姿态编码，并使用自回归生成变换器进行有效的手部运动序列预测。我们在健康受试者参与的初步研究中展示了这些新方法的实用性。为了训练和评估所提出的方法，我们收集了一个包含来自多名受试者的不同类型物体的各种抓取动作的数据集。通过广泛的实验，我们证明了提出的方法能够成功预测序列手部运动。尤其值得注意的是，注视信息在较少输入帧的情况下显著增强了预测能力，突显了提出的方法在实际应用中的潜力。

发布时间: 4/3/2025

查看原文

LLM 穿普拉达：通过在线购物数据分析性别偏见和刻板印象

作者: Massimiliano Luca, Ciro Beneduce, Bruno Lepri, Jacopo Staiano

arXiv:2504.01951v1 宣告类型: 新摘要: 随着大型语言模型在各个领域的广泛应用，评估其惊人的性能背后所依赖的训练数据中的统计相关性所隐藏的微妙且可能令人担忧的偏差变得至关重要。性别偏差在大型语言模型中已从职业、爱好和通常与特定性别相关的感情等多个方面广泛研究。在这项研究中，我们引入了一个新颖的角度。我们研究大型语言模型是否仅凭个人的在线购物历史就能预测其性别，以及这些预测是否受到性别偏见和刻板印象的影响。使用来自美国用户的在线购买历史数据集，我们评估了六种大型语言模型对性别的分类能力，然后分析了它们的推理过程和产品-性别共现模式。结果显示，虽然模型可以以中等准确性推断性别，但他们的决策通常是基于产品类别与性别之间的刻板印象关联。此外，明确指示避免偏见可以降低模型预测的确定性，但并不能消除刻板印象模式。我们的发现突显了大型语言模型中性别偏见的持久性，并强调了需要有效的偏见缓解策略。

发布时间: 4/3/2025

查看原文

批判性思维：哪些类型的复杂性决定了最佳推理长度？

作者: Celine Lee, Alexander M. Rush, Keyon Vafa

arXiv:2504.01935v1 宣告类型: 新摘要: 大型语言模型（LLMs）在推理时通常可以从 verbalized 推理中受益，但这些额外的推理标记解决的任务难度的哪些方面仍不清楚。为了探究这一问题，我们通过确定性有限自动机（DFAs）的形式化框架进行了研究。DFAs 提供了一种通过可测量属性（如运行长度，即所需的推理步骤数量，和状态空间大小，即决策复杂度）来表征任务复杂性的方法。我们首先展示了，在不同任务和不同规模及训练范式的模型中，存在一个最优的推理标记数量，使得产生正确解的概率最大化。然后我们调查了哪些复杂性的属性决定了这一关键长度：我们发现，具有较长相应 DFA 运行时间的任务实例（即，需要更大的潜在状态跟踪需求）与较长的推理长度相关，但令人惊讶的是，DFA 的大小（即状态空间复杂度）并不相关。随后，我们证明了这些发现的含义：能够预测新问题的最佳推理标记数量，并过滤掉非最优长度的答复，可以实现一致的准确性提升。

发布时间: 4/3/2025

查看原文

提升AI科学家理解：通过可解释的推理使大语言模型像物理学家一样思考

作者: Yinggan Xu, Hana Kimlee, Yijia Xiao, Di Luo

arXiv:2504.01911v1 宣告类型: 新摘要: 大型语言模型（LLMs）在物理研究中发挥了日益重要的作用，通过增强推理、符号操作和数值计算。然而，确保其输出的可靠性和可解释性仍然是一个重大挑战。在我们的框架中，我们将AI与人类科学家的合作视为三个模块之间动态互动的结果：推理模块、解释模块和AI-科学家交互模块。认识到有效的物理推理需要严格的逻辑一致性、定量精确性和与现有理论模型的深度整合，我们引入了解释模块以提高对AI生成输出的理解，这是文献中尚未探讨的内容。该模块包含多个专门代理，包括摘要生成器、模型构建器、用户界面生成器和测试器，它们协作在物理基础上结构化LLM输出，构建一个更具可解释性的科学模型。一个案例研究显示，我们的方法提高了透明度，促进了验证，并增强了科学发现中的AI增强推理。

发布时间: 4/3/2025

查看原文

CoRAG: 合作检索增强生成

作者: Aashiq Muhamed, Mona Diab, Virginia Smith

arXiv:2504.01883v1 通知类型: 新增摘要: 在知识密集型任务中，检索增强生成（RAG）模型表现优异，尤其是在少量样本学习的约束条件下。我们介绍了一种名为CoRAG的框架，该框架将RAG扩展到了协作环境中，在这种环境中，客户端共同训练共享模型并使用协作段落存储库。为了评估CoRAG，我们引入了CRAB基准，用于协作同质开放域问答。我们的实验表明，在资源有限的情景中，CoRAG始终优于参数协作学习方法和本地训练的RAG模型。进一步的分析揭示了共享存储库中相关段落的重要性，意外的无关联段落带来的好处，以及难以匹配的负样本可能对性能的负面影响。这引入了协作RAG中的一个新考虑因素：共同丰富知识库带来的利用机会与从其他客户端引入有害段落的风险之间的权衡。我们的发现强调了CoRAG的可行性，同时也指出了关键设计挑战和未来研究的前景。

发布时间: 4/3/2025

查看原文

技术AGI的安全与安全方法

作者: Rohin Shah, Alex Irpan, Alexander Matt Turner, Anna Wang, Arthur Conmy, David Lindner, Jonah Brown-Cohen, Lewis Ho, Neel Nanda, Raluca Ada Popa, Rishub Jain, Rory Greig, Samuel Albanie, Scott Emmons, Sebastian Farquhar, S\'ebastien Krier, Senthooran Rajamanoharan, Sophie Bridgers, Tobi Ijitoye, Tom Everitt, Victoria Krakovna, Vikrant Varma, Vladimir Mikulik, Zachary Kenton, Dave Orr, Shane Legg, Noah Goodman, Allan Dafoe, Four Flynn, Anca Dragan

arXiv:2504.01849v1 宣告类型: 新摘要: 通用人工智能(AGI)承诺带来革命性的益处，同时也带来了显著的风险。我们发展了一种方法，以应对可能导致人类遭受重大损害的风险。我们识别了四种风险领域：滥用、不对齐、错误和结构风险。在这之中，我们将重点放在技术手段来应对滥用和不对齐问题。对于滥用，我们的策略旨在防止威胁行为者访问危险的能力，通过主动识别危险的能力，以及实施强大的安全措施、访问限制、监控和模型安全性缓解措施。为了应对不对齐问题，我们提出了两条防线。首先，模型层面的缓解措施，如增强的监督和稳健的训练，可以帮助构建一个对齐的模型。其次，系统层面的安全措施，如监控和访问控制，即使模型不对齐也能减轻损害。可解释性技术、不确定性估计以及更安全的设计模式可以增强这些缓解措施的有效性。最后，我们简要阐述了如何将这些要素结合起来为AGI系统生成安全性案例。

发布时间: 4/3/2025

查看原文

PaperBench：评估AI复制AI研究的能力

作者: Giulio Starace, Oliver Jaffe, Dane Sherburn, James Aung, Jun Shern Chan, Leon Maksin, Rachel Dias, Evan Mays, Benjamin Kinsella, Wyatt Thompson, Johannes Heidecke, Amelia Glaese, Tejal Patwardhan

arXiv:2504.01848v1 里程碑类型: 新摘要: 我们介绍了PaperBench，这是一个评估AI代理复制最新AI研究能力的基准。代理必须从头开始复制20篇ICML 2024的Spotlight和Oral论文，包括理解论文贡献、开发代码库以及成功执行实验。为了实现客观评价，我们开发了一套评价标准，将每个复制任务逐级分解为更小的子任务，并具有明确的评分标准。Total而言，PaperBench包含了8,316个独立可评分的任务。评分标准与每篇ICML论文的作者共同开发，以确保准确性和现实性。为了实现可扩展的评估，我们还开发了一个基于LLM的裁判系统，自动根据评分标准对复制尝试进行评分，并通过创建一个单独的裁判基准来评估我们裁判系统的表现。我们针对PaperBench评估了几种前沿模型，发现表现最佳的测试代理Claude 3.5 Sonnet（新版本）带有开源架构，实现了平均复制得分为21.0%。最后，我们招募了顶尖的ML博士来尝试PaperBench的一部分，发现模型尚未超越人类基准线。我们[在这里开源我们的代码](https://github.com/openai/preparedness)，以促进未来研究，了解AI代理的AI工程能力。

发布时间: 4/3/2025

查看原文