arXiv 论文列表

作者: Haixing Gong, Hui Zou, Xingzhou Liang, Shiyuan Meng, Pinlong Cai, Xingcheng Xu, Jingjing Qu

arXiv:2503.09257v4 通知类型: 替换交叉摘要：在飞速发展的人工智能（AI）领域，映射创新模式并理解从研究到应用的有效技术转移是经济增长的关键。然而，现有的数据基础设施存在碎片化、覆盖率不完整和评估能力不足的问题。在这里，我们介绍了 DeepInnovationAI，这是一个全面的全球性数据集，包含三个结构化的文件。DeepPatentAI.csv：包含 2,356,204 个专利记录，附有 8 个领域特定属性。DeepDiveAI.csv：涵盖了 3,511,929 篇学术出版物，附有 13 个元数据字段。这两个数据集利用了大型语言模型、多语言文本分析以及双层 BERT 分类器，以准确识别与 AI 相关的内容，同时利用超图分析来创建稳健的创新指标。此外，DeepCosineAI.csv：通过应用语义向量邻近分析，此文件呈现了约一百万篇论文-专利相似度配对，以增强对理论进步如何转化为商业技术的理解。DeepInnovationAI 使研究者、政策制定者和行业领导者能够预见趋势并识别合作机会。凭借广泛的 temporal 和地理范围，它支持对技术发展模式和国际竞争动态进行详细分析，并建立模拟 AI 创新和技术转移过程的基础。

发布时间: 3/31/2025

查看原文

K-12和高等教育中生成式人工智能来临之际的AI素养：一项综合review

作者: Xingjian Gu, Barbara J. Ericson

arXiv:2503.00079v3 公告类型: 交叉替换摘要：尽管生成型AI的兴起使得AI素养成为了教育领域的突出话题，但其定义依然模糊不清。研究者和实践者在讨论和设计AI素养干预措施时缺乏共识。此一术语既被用来描述针对本科生学习如何有效使用ChatGPT的学习活动，也被用来指代让幼儿与社会机器人互动。本文应用综合审查方法，对2020年以来发表的关于AI素养的实证和理论研究进行了审查。在综合分析了124项研究后，本文识别出了三种关于AI素养的概念化方式：功能性、批判性和间接有益的；以及三种关于AI的看法：技术细节、工具和社会文化，形成了一个反映实践中AI素养如何被处理的框架。该框架突显了在AI素养讨论中需要更具专门性的术语，指出了某些AI素养目标研究中的空白。

发布时间: 3/31/2025

查看原文

脚踏门：LLMs的多轮脱缰对话

作者: Zixuan Weng, Xiaolong Jin, Jinyuan Jia, Xiangyu Zhang

arXiv:2502.19820v3 安全声明类型: replace-cross 摘要：随着大型语言模型越来越多地融入实际应用，确保AI安全变得至关重要。一个关键挑战是脱管攻击，即敌对提示绕过内置的安全措施以激发有害的禁止输出。受到心理学中途进门原则的启发，我们介绍了FITD，一种新颖的多回合脱管攻击方法，利用了一个现象，即初始的小规模承诺降低了对更大或更不道德的侵犯的抵抗。我们的方法通过中间桥接提示逐步提升用户查询的恶意意图，并通过自身引导模型的响应以诱导有毒的回复。在两个脱管攻击基准上的广泛实验结果显示，FITD 在七个广泛使用模型上实现了平均每回合攻击成功率94%，超过了现有最先进的方法。此外，我们还深入分析了LLM自我腐蚀，强调了当前对齐策略中的漏洞，并强调了多回合交互中固有的风险。代码可在 https://github.com/Jinxiaolong1129/Foot-in-the-door-Jailbreak 获取。

发布时间: 3/31/2025

查看原文

CoRPA：使用概念向量扰动和生成模型的胸X光 adversarial 图像生成

作者: Amy Rafferty, Rishi Ramaesh, Ajitha Rajan

arXiv:2502.05214v2 通知类型: 交叉替换摘要：用于医疗图像分类任务的深度学习模型正在AI辅助诊断工具中得到广泛应用，旨在提高诊断准确性、减轻临床人员的工作负担并改善患者结果。然而，它们对对抗攻击的脆弱性给患者安全带来了重大风险。当前的攻击方法采用一般技术，如模型查询或像素值扰动，以生成旨在欺骗模型的对抗样本。这些方法可能未能充分解决源自临床特征遗漏或错误识别的独特临床错误特征。我们提出了一种以临床为导向的黑盒对抗攻击框架——概念基础报告扰动攻击（CoRPA），专为医疗成像领域设计。CoRPA 利用临床概念生成与真实的临床误诊场景高度相似的对抗放射学报告和图像。我们使用MIMIC-CXR-JPG胸部X光和放射学报告数据集展示了CoRPA的实用性。我们的评估显示，传统对抗攻击下表现出强大抗性的深度学习模型，在面对CoRPA的临床导向扰动时，其鲁棒性显著下降。这突显了在医疗AI系统中解决领域特定漏洞的重要性。通过引入专门的对抗攻击框架，本研究为在高风险临床环境中开发安全可靠的AI模型奠定了基础，确保其在医疗保健领域的安全部署。

发布时间: 3/31/2025

查看原文

基于改进的IR的智能化相关反馈软件漏洞本地化

作者: Asif Mohammed Samir, Mohammad Masudur Rahman

arXiv:2501.10542v2 宣布类型: 替换-交叉摘要：软件bug在开发和维护过程中构成了一个重大挑战，实践者花费近50%的时间来处理bug。许多现有的技术采用信息检索（IR）技术通过bug报告与源代码之间的文本和语义相关性来定位报告的bug。然而，它们往往难以弥合bug报告和代码之间的一个关键差距，这需要深入的上下文理解，而这种理解超出了文本或语义相关性所能达到的范围。本文提出了一种新的bug定位技术——BRaIn——通过使用大型语言模型（LLM）评估bug报告与代码之间的相关性来填补这些上下文差距。然后，它利用LLM的反馈（即智能相关反馈）来重新制定查询并重新排名源文档，从而改善bug定位。我们使用基准数据集Bench4BL和三种性能指标评估了BRaIn，并将其与文献中的六种基线技术进行了比较。实验结果显示，BRaIn在MAP、MRR和HIT@K上的表现分别优于基线技术87.6%、89.5%和48.8%。此外，它还能定位大约52%的基线技术由于对应的bug报告质量差而无法定位的bug。通过填补上下文差距并引入智能相关反馈，BRaIn不仅推进了理论发展，还提高了基于信息检索的bug定位的效果。

发布时间: 3/31/2025

查看原文

基于混合动作的多目标兼容自主驾驶强化学习

作者: Guizhe Jin, Zhuoren Li, Bo Leng, Wei Han, Lu Xiong, Chen Sun

arXiv:2501.08096v2 通知类型: 替换-交叉摘要：强化学习（RL）在解决自主驾驶的决策制定和控制问题方面表现出卓越的性能，这些方法正越来越多地应用于多样化的驾驶场景中。然而，驾驶是一个多元属性的问题，这给当前的RL方法带来了在策略执行和策略迭代中实现多重目标兼容性的挑战，尤其是在政策执行和政策迭代中。一方面，具有单一动作类型的通用动作空间结构限制了驾驶的灵活性，或者导致在策略执行过程中出现大的行为波动。另一方面，多重属性加权单奖励函数导致代理在策略迭代中对某些目标的关注程度不均衡。为了解决这一问题，我们提出了一种适用于多重目标兼容自主驾驶的混合参数化动作的多目标集成批评强化学习方法。具体来说，构建了一个参数化动作空间，生成混合驾驶动作，结合了抽象指导和具体控制指令。考虑到多种属性奖励，构建了一个多目标批评架构，以确保同时关注不同的驾驶目标。此外，引入了一种基于不确定性的探索策略，以帮助代理更快地接近可行的驾驶策略。在模拟交通环境和HighD数据集中的实验结果表明，我们的方法在驾驶效率、动作一致性以及安全性方面实现了多重目标兼容的自主驾驶。这种方法在提高驾驶性能的同时，显著提高了训练效率。

发布时间: 3/31/2025

查看原文

VidTwin：解耦结构与动力学的视频VAE

作者: Yuchi Wang, Junliang Guo, Xinyi Xie, Tianyu He, Xu Sun, Jiang Bian

arXiv:2412.17726v2 通知类型: 替换-交叉摘要：近年来，视频自编码器（Video AEs）的发展显著提高了视频生成的质量和效率。本文中，我们提出了一个新颖且紧凑的视频自编码器VidTwin，将视频解耦为两个独立的潜在空间：结构潜在向量，捕捉总体内容和全局运动；动力学潜在向量，代表精细细节和快速运动。具体而言，我们的方法采用了编码器-解码器骨干网络，并附加了两个子模块以提取这些潜在空间。第一个子模块使用Q-Former提取低频运动趋势，随后通过下采样块去除冗余内容细节。第二个子模块沿空间维度平均潜在向量以捕捉快速运动。广泛的实验显示，VidTwin 在MCL-JCV数据集上实现了高重建质量（PSNR为28.14）和高达0.20%的压缩率，并且在下游生成任务中表现出高效性和有效性。此外，我们的模型展示了可解释性和可扩展性，为未来的视频潜在表示和生成研究铺平了道路。欲了解更多信息，请访问我们的项目页面：https://vidtwin.github.io/。

发布时间: 3/31/2025

查看原文

PromptLA: 向量化黑盒文本生成图片扩散模型的完整性验证

作者: Zhuomeng Zhang, Fangqi Li, Chong Di, Hongyu Zhu, Hanyi Wang, Shilin Wang

arXiv:2412.16257v2 宣布类型: replace-cross 摘要：尽管文本到图像（T2I）扩散模型在图像合成质量上取得了令人印象深刻的进展，但它们的黑盒部署仍面临重大的监管挑战：恶意行为者可以通过调整模型参数来生成非法内容，从而绕过现有的安全措施。因此，验证T2I扩散模型的完整性是必不可少的。为此，鉴于生成模型输出中的随机性以及与其交互的高成本，我们通过生成图像中特征分布的KL散度来辨别模型篡改。我们提出了基于学习自动机的新型提示选择算法（PromptLA），以实现高效且准确的验证。我们在四个高级T2I模型（例如SDXL、FLUX.1）上的评估表明，我们的方法在完整性检测中的平均AUC超过0.96，超过基线方法0.2以上，展示了很强的有效性和泛化能力。此外，我们的方法具有较低的成本，并且能够抵御图像层面的后处理攻击。据我们所知，这篇论文是首次针对T2I扩散模型的完整性验证进行的工作，它为实践中的AI版权诉讼建立了可量化的标准。

发布时间: 3/31/2025

查看原文

生成视频能替代 cinematographers 吗？关于生成视频的电影语言研究

作者: Xiaozhe Li, Kai WU, Siyi Yang, YiZhan Qu, Guohua. Zhang, Zhiyu Chen, Jiayao Li, Jiangchuan Mu, Xiaobin Hu, Wen Fang, Mingliang Xiong, Hao Deng, Qingwen Liu, Gang Li, Bin He

arXiv:2412.12223v2 宣告类型: replace-cross 摘要：近期在文本生成视频（T2V）方面的进展利用了扩散模型来增强从文本描述合成的视频中的视觉连贯性。然而，现有研究主要集中在物体运动上，经常忽略了电影语言，这在电影制作中对于传达情感和叙事节奏至关重要。为了解决这个问题，我们提出了一种三阶段方法来提高T2V模型的电影控制能力。首先，我们引入了一个详细标注的电影语言数据集，包含二十个子类别，涵盖镜头构图、镜头角度和摄像机运动，使模型能够学习多种电影风格。其次，我们提出了CameraDiff，它利用LoRA实现精确和稳定的电影控制，确保灵活的镜头生成。第三，我们提出了CameraCLIP，旨在评估电影对齐和引导多镜头组成。基于CameraCLIP，我们引入了CLIPLoRA，这是一种由CLIP引导的动态LoRA组合方法，能够自适应地融合多个预训练电影LoRA，实现平滑过渡和无缝风格融合。实验结果表明，CameraDiff确保了稳定和精确的电影控制，CameraCLIP实现了0.83的R@1分数，并且CLIPLoRA显著提高了一视频内多镜头组成的性能，缩小了自动化视频生成与专业电影制作之间的差距。

发布时间: 3/31/2025

查看原文

对抗标签噪声学习中的语义污染

作者: Wenxiao Fan, Kan Li

arXiv:2412.11620v3 通知类型: replace-cross 摘要: 噪声标签会负面影响深度神经网络的性能。一种常见的解决方案是标签修复，这涉及通过预测和分布重构噪声标签。然而，这些方法可能会引入有问题的语义关联，我们将其现象称为语义污染。通过对Robust LR这一代表性的标签修复方法进行分析，我们发现利用视图的logits进行修复无法充分平衡单一类别的语义信息。相反，使用模型的logits进行修复则无法在模型间保持一致的语义关系，解释了为什么标签修复方法经常遇到与语义污染相关的难点。为了解决这一问题，我们提出了一种名为协作交叉学习的新方法，该方法利用在修复标签上进行半监督学习，从视图和模型的嵌入中提取合适的语义关联。实验结果显示，我们的方法在合成和现实世界噪声数据集上均优于现有方法，有效减轻了标签噪声和语义污染的影响。

发布时间: 3/31/2025

查看原文