LLM2D

arXiv 论文列表

作者: Takafumi Ito, Lysenko Artem, Tatsuhiko Tsunoda
arXiv:2505.10037v1 类型: cross 摘要: 量子-经典混合机器学习(QHML)模型因其在较小数据集上的稳健性能和高泛化能力而受到认可。这些特性为样本数量通常较小的抗癌药物响应预测提供了独特的优势。然而,这类混合模型似乎非常敏感于神经网络和量子电路接口处的数据编码方式,不理想的编码选择会导致稳定性问题。为了解决这个问题,我们提出了一种新的策略,该策略基于一种改良的梯度版本的 $\tanh$ 归一化函数。该方法将神经网络的输出转换,而不使其集中在极端值范围内。我们的想法在各种癌症细胞系的基因表达和药物反应测量数据集上进行了评估,我们将经典深度学习模型与几种QHML模型的预测性能进行了比较。这些结果证实,在数据最优归一化的情况下,QHML表现优于经典模型。这项研究为使用量子计算机进行生物医学数据分析打开了新的可能性。
发布时间: 5/16/2025
查看原文
arXiv:2505.10027v1 宣告类型: cross 摘要:随着遥感技术的迅速发展,超分辨率图像重建在研究和实践方面都具有重要意义。现有的深度学习方法已取得进展,但在处理复杂场景和保护断细节方面仍存在局限性。本文提出了一种基于强化学习的潜在扩散模型(LDM)微调方法,用于遥感图像超分辨率。该方法构建了一个由状态、动作和奖励组成的强化学习环境,在LDM模型的逆去噪过程中通过最近邻策略优化(PPO)优化决策目标。在RESISC45数据集上的实验显示,该方法在PSNR、SSIM和LPIPS方面比基准模型有显著改进,PSNR提高了3-4dB,SSIM提高了0.08-0.11,LPIPS降低了0.06-0.10,特别是在结构化和复杂的自然场景中。结果表明该方法在提高超分辨率质量和适应场景方面具有有效性。
发布时间: 5/16/2025
查看原文
arXiv:2505.10016v1 类型: cross 摘要:自主驾驶技术正在逐步改变传统的驾驶方法,标志着现代交通的一个重要里程碑。目标检测是自主系统的核心,对于提高驾驶安全性、实现自主功能、提高交通效率以及促进有效的应急响应发挥着至关重要的作用。然而,现有的技术如用于环境感知的雷达、用于道路感知的摄像头以及车辆传感器网络面临显著挑战,包括高昂的成本、对天气和光照条件的敏感性以及有限的分辨率。为了解决这些限制,本文基于YOLOv8提出了一个改进的自主目标检测网络。通过将结构重参数化技术、双向分层结构网络模型以及新的检测流水线整合到YOLOv8框架中,所提出的方法能够高效且精准地检测多尺度、小型和远程目标。实验结果表明,改进后的模型能够有效地检测大型和小型目标,检测准确率达到65%,在传统方法上显示出显著的进步。这种改进的模型在实际应用中具有巨大潜力,并且非常适合用于自主驾驶竞赛,如Formula Student Autonomous China (FSAC),尤其在涉及单一目标和小型目标检测的场景中表现出色。
发布时间: 5/16/2025
查看原文
arXiv:2505.10012v1 交叉学科类型:交叉 摘要:近年来,人工智能(AI)和量子计算的进步正在加速科学研究和工程过程中的自动化,从根本上重塑了研究方法。本文突出了科学研究自动化与已建立的计算机辅助工程(CAE)实践之间的相似之处,提出了量子CAE框架,该框架利用量子算法在工程设计中进行模拟、优化和机器学习。通过组合优化问题的案例研究说明了量子CAE的实际实现。进一步的讨论包括向更高自动化水平的发展,强调了擅长量子算法设计的专业AI代理的关键作用。量子计算与AI的集成引发了关于人类科学家和工程师、AI系统和量子计算资源之间协作动态的重大问题,强调了自动化发现和创新的变革性未来。
发布时间: 5/16/2025
查看原文
作者: Tella Rajashekhar Reddy, Palak, Rohan Gandhi, Anjaly Parayil, Chaojie Zhang, Mike Shepperd, Liangcheng Yu, Jayashree Mohan, Srinivasan Iyengar, Shivkumar Kalyanaraman, Debopam Bhattacherjee
arXiv:2505.09989v1 类型: cross 摘要:AI的能源需求正在前所未有的增长,这得益于AI计算的高能量密度和新兴的推理负载。在供应方面,大量的风能正等待接入电网。在这一背景下,本文主张将AI工作负载部署到与风电场共址的模块化计算集群中。我们的部署规模适配策略使得在今天能够经济地部署超过600万台高端GPU,这些GPU可以就地消耗便宜且绿色的电力。我们构建了Heron,一种跨站点的软件路由器,能够通过绕过电力下降边缘有效地利用风电场间发电的互补性。利用来自Azure的1周编码和对话生产跟踪数据以及实际的可变风力发电跟踪数据,我们展示了Heron相比于现有最佳方案,如何将AI计算的整体吞吐量最多提高80%。
发布时间: 5/16/2025
查看原文
arXiv:2505.09974v1 宣告类型: cross 摘要: 将大型语言模型(LLMs)整合到网络安全应用中带来了显著的机会,例如增强威胁分析和恶意软件检测,但也可能引入关键风险和安全顾虑,包括个人数据泄露和自动生成新的恶意软件。本文系统评估了为网络安全应用微调的LLMs的安全风险。基于OWASP Top 10 for LLM Applications框架,我们评估了七款开源LLMs:Phi 3 Mini 3.8B、Mistral 7B、Qwen 2.5 7B、Llama 3 8B、Llama 3.1 8B、Gemma 2 9B和Llama 2 70B。我们的评估结果显示,微调降低了所有测试LLMs的安全弹性(例如,Llama 3.1 8B对抗提示注入的安全评分为0.95降至0.15)。我们提出并评估了一种安全对齐方法,通过精细地重写指令-响应对,明确包含安全预防措施和伦理考量。这种方法表明,在保持甚至提高模型安全性的同时,可以保留技术实用性,提供了一条开发更安全的微调方法的实用途径。本文提供了一种针对LLMs的安全风险的系统评估,有助于在敏感领域更安全地采用生成型AI,并为开发安全、可信赖且伦理对齐的LLMs作出贡献。
发布时间: 5/16/2025
查看原文
作者: Ali Azimi Lamir, Shiva Razzagzadeh, Zeynab Rezaei
arXiv:2505.09969v1 Announce Type: cross 摘要:本文提出了一种基于机器学习的框架,用于使用包含303个样本和14个特征的心脏疾病数据集进行心脏疾病预测。该方法包括数据预处理、模型训练和使用逻辑回归、K-最近邻(KNN)和随机森林三种分类器进行评估。通过GridSearchCV和RandomizedSearchCV进行超参数调优以提升模型性能。随机森林分类器在其他模型中脱颖而出,准确率达到91%,F1分数为0.89。精确率、召回率和混淆矩阵等评估指标显示出各分类表现的均衡性。所提出的模型展示了通过有效预测心脏疾病来辅助临床决策的强大潜力。数据集规模和普适性等限制强调了未来研究需要使用更大、更具多样性的数据集进行的重要性。本文突显了机器学习在医疗保健领域的应用价值,为预测诊断的进步提供了新的见解。
发布时间: 5/16/2025
查看原文
arXiv:2505.09955v1 宣传类型:交叉 摘要:时间序列数据的无监督领域适应(UDA)仍然是深度学习中的一个关键挑战,传统的伪标签策略无法捕捉到时间模式和领域之间的通道变化,从而生成次优伪标签。因此,我们引入了TransPL,这是一种新颖的方法,通过代码转换矩阵来解决这些问题,其中代码来自于时间序列片段的矢量量化(VQ)。我们的方法从源领域构建类别和通道级别的代码转换矩阵,并利用贝叶斯规则进行目标领域的适应,基于通道级别的加权类别条件似然生成伪标签。TransPL 提供了三个关键优势:明确建模不同领域之间的时间转换和通道变化,适用于不同的无监督领域适应场景(如弱监督无监督领域适应),以及可解释的伪标签生成。我们通过对四个时间序列无监督领域适应基准的广泛分析验证了TransPL的有效性,并确认它在所有情况下都显著优于最先进的伪标签方法(准确率提高6.1%,F1分数提高4.9%),并通过其学习到的代码转换矩阵提供了对领域适应过程的可解释见解。
发布时间: 5/16/2025
查看原文
作者: Tianyu Huai, Jie Zhou, Yuxuan Cai, Qin Chen, Wen Wu, Xingjiao Wu, Xipeng Qiu, Liang He
arXiv:2505.09952v1 通告类型: cross 摘要:在本文中,我们关注一项长期连续学习(CL)任务,其中模型会依次从随着时间推移不断涌来的大量任务流中学习,以类似人类学习的方式获取新知识并保留之前学到的信息。与传统的连续学习环境不同,长期连续学习涉及处理的任务数量显著更多,这加剧了灾难性遗忘的问题。我们的工作旨在解决两个关键问题:1)现有连续学习方法在长期连续学习的上下文中表现如何?2)如何缓解由长时间顺序更新引起的灾难性遗忘?为了解决这些挑战,我们提出了一种受人类记忆机制启发的新框架,用于长期连续学习(Long-CL)。具体来说,我们引入了一种任务核心记忆管理策略,以高效地索引关键记忆,并在学习过程中适当地更新它们。此外,我们还开发了一种长期记忆巩固机制,该机制有选择性地保留难且有区别的样本,以确保知识的有效保留。为了促进该领域的研究,我们构建并释放了两个多模态和文本基准数据集,MMLongCL-Bench 和 TextLongCL-Bench,为评估长期连续学习方法提供了宝贵的资源。实验结果表明,Long-CL 分别在两个基准数据集上比之前最先进的方法在两个指标上分别取得了 7.4% 和 6.5% 的 AP 提升,这表明我们方法的有效性。
发布时间: 5/16/2025
查看原文
作者: Deeksha Prahlad, Chanhee Lee, Dongha Kim, Hokeun Kim
arXiv:2505.09945v1 类别: cross 摘要:大语言模型(LLMs)的出现使许多应用程序得以利用,包括在聊天机器人和其他对话助手中生成查询响应。由于在大量数据上进行训练,LLMs 经常表现出高度过拟合,导致生成多余的错误数据,从而在输出生成中产生幻觉。这些问题的部分原因在于缺乏及时、准确且个性化的信息输入给 LLM。本文中,我们提出了一种通过引入基于知识图谱(KGs)的检索增强生成(RAG)来解决这些问题的方法,以帮助 LLM 生成个性化的响应,从而适应用户需求。知识图谱的优势在于可以以结构化的方式存储不断更新的事实信息。虽然我们的知识图谱可以用于各种频繁更新的个性化数据,如日历、联系人和位置数据,但我们在这篇文章中专注于日历数据。我们的实验结果显示,与使用个人信息文本输入作为输入的基础 LLM 相比,我们的方法在理解和生成准确响应方面有显著的改善,同时响应时间略有减少。
发布时间: 5/16/2025
查看原文