LLM2D

arXiv 论文列表

arXiv:2505.06652v1 交叉公告类型 摘要:国际象棋教学已经通过不同的方法演进,然而,传统的基于记忆的方法与生成式人工智能新技术带来的新可能性形成了对比,而这项技术在该领域仍然很少被探索。本研究旨在通过实验验证“Odychess 方法”在提高学生的国际象棋知识、战略理解及元认知技能方面的有效性。进行了一个准实验研究,采用前测/后测设计,并设有一个控制组(N=60)。实验干预实施了“Odychess 方法”,结合了一个特别调整过的 Llama 3.3 语言模型,该模型使用参数高效微调(PEFT)技术作为苏格拉底式国际象棋导师。使用定量评估工具测定了实验干预前后学生的国际象棋知识、战略理解和元认知技能。准实验研究的结果显示,实验组在这三个分析变量方面与对照组相比有显著改善:国际象棋知识、战略理解和元认知技能。补充性的定性分析揭示,采用“Odychess 方法”为基础的干预的学生在分析深度、辩证推理的发展以及内在动机方面都有所提高。Odychess 方法代表了一种有效且具有教育意义的教学方法,证明了构建主义和辩证原则与生成式人工智能协同整合的潜力。这项工作的含义对于有兴趣采用创新教学技术的教育者和机构以及在教育领域应用人工智能的研究人员来说是重要的,强调了语言模型调整方法的可移植性,可以应用于其他教育领域。
发布时间: 5/13/2025
查看原文
作者: Zehan Zhu, Yan Huang, Xin Wang, Shouling Ji, Jinming Xu
arXiv:2505.06651v1 宣布类型: 交叉 摘要: 大多数现有的带差分隐私(DP)保障的去中心化学习方法依赖于恒定的梯度裁剪界和每个节点在整个训练过程中固定水平的DP高斯噪声,这导致与非私有对等相比显著的准确率下降。在本文中,我们提出了一种新的动态差分隐私去中心化学习方法(称为Dyn-D$^2$P),适用于一般的时间变化有向网络。利用高斯DP(GDP)框架进行隐私核算,Dyn-D$^2$P根据梯度收敛动态调整梯度裁剪界和噪声水平。提出的这种动态噪声策略使我们在保持总隐私预算的同时,能够提升模型准确率。在基准数据集上的广泛实验表明,Dyn-D$^2$P相较于采用固定水平噪声的对等方法,特别是在强隐私保障下,表现出优越性。此外,我们为Dyn-D$^2$P提供了可证明的效用上限,该上限明确依赖于网络相关参数,并且在节点数量n的$\sqrt{n}$缩放因子下具有一个由梯度裁剪引起的偏差误差项。据我们所知,这是首次对具有动态梯度裁剪界和噪声水平的不同差分隐私去中心化非凸优化模型的效用进行分析。
发布时间: 5/13/2025
查看原文
arXiv:2505.06632v1 类型: cross 摘要: 自动车辆(AV)的普及带来了重要的紧迫的安全和可靠性问题,必须解决这些问题以确保公共安全并促进其广泛应用。本提出的科研贡献在于通过提供异常检测、数据溯源和实时响应能力,实现更安全、可靠和值得信赖的自主运输系统。在此次研究中,我们开发了一种新的框架,该框架结合了人工智能(AI)的实时异常检测能力与区块链技术,以检测和防止任何恶意活动,包括车辆传感器故障。通过长短期记忆(LSTM)网络,我们的方法持续监控关联的多传感器数据流,以检测可能代表网络攻击或硬件故障的异常模式。此外,该框架采用去中心化的平台,将传感器数据和异常警报安全地存储在区块链账本中,以确保数据的不可篡改性和真实性,同时提供透明的取证功能。另外,当发现异常时,使用智能合约部署即时自动响应机制,这使得车辆系统更能够抵御来自网络空间和硬件组件故障的攻击。此外,我们识别了在处理高频传感器数据时的可扩展性挑战、资源受限环境下的计算限制以及分布式数据存储中的隐私问题。
发布时间: 5/13/2025
查看原文
arXiv:2505.06630v1 交叉公告类型 摘要:多领域情感分类旨在通过利用来自不同领域的标注数据,缓解因单领域标注数据稀缺而导致模型性能不佳的问题。一系列同时训练领域分类器和情感分类器的模型已经展示了其优势,因为领域分类有助于为情感分类生成必要的信息。直觉上,在多领域情感分类中,情感分类任务的重要性在所有领域中是相同的;但领域分类任务是不同的,因为领域信息对情感分类的影响在不同领域间有所变化;这可以通过可调节的权重或超参数进行控制。然而,随着领域数量的增加,现有的超参数优化算法可能会面临以下挑战:(1) 对计算资源的巨大需求,(2) 收敛问题,以及 (3) 高算法复杂度。为了高效地在每个领域生成用于情感分类所需的领域信息,我们提出了一种动态信息调控算法。具体来说,模型训练过程被分为两个阶段。在第一阶段,确定一个共享的超参数,该超参数将控制所有领域中领域分类任务的比例。在第二阶段,我们引入了一种新颖的领域感知调控算法,根据输入文本中包含的领域信息进行调整,然后基于梯度和损失的方法进行计算。总之,在一个包含16个领域的公开情感分析数据集上进行的实验结果证明了所提出方法的优越性。
发布时间: 5/13/2025
查看原文
作者: Tianhao Cai, Liang Wang, Limin Xiao, Meng Han, Zeyu Wang, Lin Sun, Xiaojian Liao
arXiv:2505.06625v1 平台类型: 交叉 摘要:随着DNN应用的快速发展,多租户执行成为一种主流趋势,即多个DNN共驻在一个单片SoC上。尽管在前期工作中提出了许多方法来提高多租户性能,但共享缓存的影响尚未得到充分研究。本文提出了一种名为CaMDN的架构-调度协同设计,以增强在集成NPUs上运行的多租户DNN的缓存效率。具体而言,提出了一种轻量级架构,支持共享缓存内的模型专属、NPU控制区域,以消除意外的缓存争用。此外,提出了一种缓存调度方法来提高共享缓存的利用率。特别是,它包括一种缓存感知映射方法,以适应变化的可用缓存容量,并提出了一种动态分配算法,在运行时调整共驻DNN之间的使用情况。与前期工作相比,CaMDN平均减少33.4%的内存访问,最高实现2.56倍(平均1.88倍)的模型加速。
发布时间: 5/13/2025
查看原文
作者: Dima Alattal, Asal Khoshravan Azar, Puja Myles, Richard Branson, Hatim Abdulhussein, Allan Tucker
arXiv:2505.06620v1 Announce 类型: cross 摘要:医疗保健中对人工智能(AI)和机器学习(ML)的需求正在增长,尤其是在作为临床决策支持系统来辅助医疗专业人员方面。然而,许多这些模型的复杂性,通常被称为“黑箱”模型,使得在临床环境中安全地集成它们变得令人担忧,因为难以理解它们是如何得出预测结论的。本文讨论了由英国药品和医疗产品监管机构(MHRA)召集的专家工作组所获得的见解和建议。该工作组包括医疗专业人员、监管人员和数据科学家,其主要关注点是评估在临床决策背景下不同AI算法的输出。此外,该工作组还评估了一项试点研究的结果,该研究调查了临床诊断期间医生们对AI方法的行为和互动情况。在临床环境中引入AI方法对于确保医疗AI设备的安全性和可信度至关重要。对于利益相关者进行足够的培训是必要的,以解决潜在问题,并提供了关于如何在医疗保健环境中安全采用AI系统的进一步见解和建议。
发布时间: 5/13/2025
查看原文
arXiv:2505.06612v1 社交推荐类型: 交叉 摘要: 在社交媒体快速发展时代,混合推荐系统作为社交推荐系统已经广泛应用于各种场景。现有方法通过捕捉用户之间的兴趣相似性来过滤掉社交网络中的兴趣无关关系,虽然这些方法不可避免地降低了推荐的准确性,但有限的研究关注于社交网络和用户-物品交互网络之间的语义信息相互影响,以进一步提高社交推荐效果。为了解决这些问题,我们引入了一种具有鲁棒图去噪增强融合与多语义建模(Burger)的社交推荐模型。具体来说,我们首先提出构建社交张量以平滑模型的训练过程。然后,使用图卷积网络和张量卷积网络分别捕获用户的物品偏好和社会偏好。考虑到用户-物品交互网络和社会网络中的不同语义信息,我们提出一种双向语义协调损失来建模语义信息的相互影响。为了减轻多语义建模中兴趣无关关系的干扰,我们进一步使用贝叶斯后验概率挖掘潜在的社会关系以替代社交噪声。最后,利用滑动窗口机制更新社交张量作为下一次迭代的输入。在三个真实数据集上的广泛实验表明,Burger相比现有最佳模型具有更优的性能。
发布时间: 5/13/2025
查看原文
作者: Hai-Vy Nguyen, Fabrice Gamboa, Sixin Zhang, Reda Chhaibi, Serge Gratton, Thierry Giaccone
arXiv:2505.06595v1 Announce Type: cross 摘要:在本文中,我们提出了一种将大型教师模型的特征表示转移到轻量级学生模型的方法。我们通过一种新的概念——感知一致性(perception coherence)进行了数学上的定义。基于这一概念,我们提出了一种损失函数,该损失函数通过数据点在特征空间中的排名来考虑数据点之间的差异。从高层次来看,通过最小化这种损失函数,学生模型学会了模仿教师模型如何感知输入。更精确地说,我们的方法是基于学生模型的表现能力弱于教师模型这一事实而提出的。因此,我们旨在开发一种新的方法,允许更好的放松。这意味着,学生模型不需要保留教师模型的绝对几何结构,只要通过差异排名保留全局一致性即可。我们的理论洞察为我们提供了特征表示转移过程的概率视角。我们的实验结果表明,与强基线方法相比,我们的方法在特征转移方面表现出更好的性能或可与基线方法持平。
发布时间: 5/13/2025
查看原文
作者: Gabriel Peyr\'e
arXiv:2505.06589v1 公告类型: 交叉 摘要: 最优传输是连接优化、偏微分方程和概率的基础数学理论。它提供了一个强大的框架用于比较概率分布,并且最近成为了机器学习中的重要工具,尤其是在设计和评估生成模型方面。这些课程笔记涵盖了最优传输的基本数学方面,包括蒙肯(Monge)和坎托罗维奇(Kantorovich)形式化方法、布涅尔(Brenier)定理、对偶形式和动力学形式、高斯分布的布尔斯(Bures)度量以及梯度流。此外,还介绍了数值方法,如线性规划、半离散求解器和熵正则化。在机器学习中的应用包括通过梯度流训练神经网络、变换器中的标记动力学以及生成对抗网络(GANs)和扩散模型的结构等内容。这些笔记主要关注数学内容,而非深度学习技术。
发布时间: 5/13/2025
查看原文
作者: Ziluo Ding, Haobin Jiang, Yuxuan Wang, Zhenguo Sun, Yu Zhang, Xiaojie Niu, Ming Yang, Weishuai Zeng, Xinrun Xu, Zongqing Lu
arXiv:2505.06584v1 宣告类型: cross 摘要: 本文介绍了 JAEGER,一种针对拟人机器人开发的双层全身控制器,旨在解决训练更具鲁棒性和多功能性的策略所面临的挑战。与传统的单控制器方法不同,JAEGER 将上身和下身的控制分离为两个独立的控制器,以便更好地专注于各自的任务。这种分离克服了维数诅咒,并提高了容错性。JAEGER 支持根速度跟踪(粗粒度控制)和局部关节角度跟踪(细粒度控制),从而实现多变且稳定的运动。为了训练控制器,我们利用了人类运动数据集(AMASS),并通过高效的目标机动网络将人类姿态转换为拟人姿态,并采用课程学习方法。该方法首先进行监督学习以初始化控制器,然后通过强化学习进一步探索。我们在两个拟人平台进行了实验,并在仿真和实际环境中证明了我们方法优于现有先进方法的优越性。
发布时间: 5/13/2025
查看原文