LLM2D

arXiv 论文列表

作者: Ruihan Yang, Zhuoqun Chen, Jianhan Ma, Chongyi Zheng, Yiyu Chen, Quan Nguyen, Xiaolong Wang
arXiv:2310.01408v3 宣告类型: 替换-交叉 摘要:动物在复杂活动如奔跑、转向、跳跃和翻跟头中的敏捷性为机器人系统设计提供了典范。将这一系列行为转移到腿足机器人系统中引入了关键问题:机器人如何同时学习多种运动行为?机器人如何以平滑过渡的方式执行这些任务?如何将这些技能整合用于广泛的应用?本文介绍了多功能可指令运动先验(VIM)——一个用于结合适用于高级机器人应用的多种敏捷运动任务的强化学习框架。我们的框架通过模仿动物动作和人工设计的动作,使腿足机器人能够学习多种多样且敏捷的低级技能。我们通过功能性奖励引导机器人采用多种技能的能力,通过样式奖励确保机器人的动作与参考动作一致。我们的VIM框架的评估涵盖了模拟和实际世界。我们的框架允许机器人在实际环境中同时使用单一基于学习的控制器学习多种敏捷运动技能。有关视频可访问我们的网站:https://rchalyang.github.io/VIM/
发布时间: 5/6/2025
查看原文
作者: Qin Chen, Jinfeng Ge, Huaqing Xie, Xingcheng Xu, Yanqing Yang
arXiv:2308.08776v2 通知类型: 替换-交叉 摘要:本文探讨了大型语言模型(LLMs)对中国劳动力市场的影响。我们通过结合人类专业知识和LLM分类,按照Eloundou等(2023)的方法分析了职业面对LLM能力的暴露程度。结果显示,职业暴露程度与工资水平和经验溢价在职业层面均呈正相关。这表明更高薪且经验密集型的工作可能面临更大的来自LLM驱动软件的暴露风险。我们随后在行业层面汇总职业暴露程度,以获得行业暴露评分。职业暴露评分和行业暴露评分与专家评估相符。我们的实证分析还表明,LLMs的影响与例行化假设存在显著差异。我们提出了一个典范的理论框架,以便更好地理解这一与先前数字技术所见的例行化假设的偏差。通过将基于熵的信息理论纳入基于任务的框架中,我们提出了一种AI学习理论,揭示了与例行化假设相比,LLM影响的不同模式。
发布时间: 5/6/2025
查看原文
作者: Weiming Zhuang, Chen Chen, Jingtao Li, Chaochao Chen, Yaochu Jin, Lingjuan Lyu
arXiv:2306.15546v3 宣告类型: replace-cross 摘要:基础模型(Foundation Model, FM)与联邦学习(Federated Learning, FL)的交集为现实世界应用开辟了新的可能性。一方面,作为协作学习范式的FL,通过扩大数据可用性、促进计算资源共享、支持FMs的协作开发、解决连续数据更新、避免FM垄断、响应延迟以及FM服务中断等问题,有助于克服FM开发中的挑战。另一方面,配备了预训练知识和出色性能的FM可以作为稳健的起点用于FL,也可以生成合成数据以丰富数据多样性并增强FL的整体性能。同时,FM为FL开启了新的共享范式和多任务及多模态能力。通过探讨FL与FM的互动,本文阐述了增强FL和FM各自能力的动机、挑战和未来方向。希望通过这项工作为未来的研究提供一个良好的基础,以推动两个领域的进步。
发布时间: 5/6/2025
查看原文
作者: Jordi de la Torre
arXiv:2302.09327v2 通知类型: 交叉替换 摘要:Transformer 是一种最初为自然语言处理开发的神经网络架构,现已发展成为解决各种问题的基础工具,包括文本、音频、图像处理、强化学习以及其他涉及异构输入数据的任务。其标志在于自注意力机制,该机制允许模型动态地加权输入序列的不同部分,这是早期基于注意力的方法的发展。本文为读者提供了理解Transformer模型最新研究所需的基础知识,并介绍了其核心组件的数学和算法基础。它还探讨了该架构的各种元素、潜在修改以及一些最相关的应用。本文用西班牙语撰写,旨在使西班牙语社区更容易获取这种科学知识。
发布时间: 5/6/2025
查看原文
作者: Simone Luetto, Fabrizio Garuti, Enver Sangineto, Lorenzo Forni, Rita Cucchiara
arXiv:2302.06375v4 公告类型:replace-cross 摘要:近期,深度学习技术在表格数据中的应用越来越受到关注,目的是在结构化的表格数据领域复制其他人工智能领域的成功。特别是在表格数据具有时间依赖性的情况下,这种兴趣更为浓厚,例如金融交易。然而,表格数据中的异构性,即分类元素与数值项混杂,使得这种适应性变得困难。在本文中,我们提出了一种变压器架构来表示具有时间依赖性的异构表格数据,其中数值特征使用一组频率函数表示,并且整个网络使用唯一的损失函数统一训练。
发布时间: 5/6/2025
查看原文
作者: Hasan Md Tusfiqur Alam, Devansh Srivastav, Abdulrahman Mohamed Selim, Md Abdul Kadir, Md Moktadirul Hoque Shuvo, Daniel Sonntag
arXiv:2504.20898v2 通告类型: 替换 摘要:生成式人工智能(AI)的进步为自动化放射学工作流程带来了巨大的潜力,但可解释性和可靠性方面的挑战阻碍了临床应用。本文提出了一种结合概念瓶颈模型(CBMs)和多Agent检索增强生成(RAG)系统的自动化放射学报告生成框架,以弥合AI性能与临床解释性的差距。CBMs将胸部X射线特征映射到人类可理解的临床概念,使疾病分类变得透明。与此同时,RAG系统整合了多Agent协作和外部知识,以生成丰富上下文和基于证据的报告。我们的演示展示了该系统提供可解释的预测、减轻幻觉、并生成高质量、个性化报告的能力,同时通过交互式界面解决准确性和可信赖性挑战。该框架为提高诊断一致性并赋予放射学家可操作的见解提供了一条途径。
发布时间: 5/6/2025
查看原文
arXiv:2504.18794v2 宣称类型: 替换 摘要:层级强化学习(HRL)被认为能够在具有稀疏奖励方案的机器人学习任务中利用固有的层级结构,这与传统的强化学习算法不同。在本次研究中,层级强化学习被评估并与其他标准的强化学习算法在复杂的导航任务中进行对比。我们评估了HRL的独特特性,包括它们创建子目标的能力以及终止函数。我们构建了实验来测试PPO和HRL之间的差异、创建子目标的不同方式、手动与自动创建子目标以及终止频率对性能的影响。这些实验突显了HRL的优势及其如何实现这些优势。
发布时间: 5/6/2025
查看原文
作者: Simon Dold, Malte Helmert, Jakob Nordstr\"om, Gabriele R\"oger, Tanja Schindler
arXiv:2504.18443v2 宣告类型:替换 摘要:我们引入了用于经典规划任务的下界证书,这些证书可以用于证明任务的不可解性或计划的最优性,并且第三方可以验证这些证明。我们描述了一个基于伪布尔约束生成下界证书的一般框架,该框架与使用的规划算法无关。 作为案例研究,我们展示了如何通过修改 \(A^*\) 算法并使用模式数据库启发式和 \(h^{\text{max}}\) 等具体示例来生成具有适度开销的最优性证明。相同的方法对所有可以通过高效表达为伪布尔约束推理的启发式方法都适用。
发布时间: 5/6/2025
查看原文
arXiv:2503.10822v3 公告类型: 替换 摘要:本文旨在讨论将强化学习方法应用于循环经济中的生命周期评估的潜在可能性,并在此方向上提出一些新的想法。为了提供一些背景,我们解释了强化学习如何成功应用于计算机象棋以及其他领域。由于计算机象棋历史上被称为“人工智能的果蝇”,我们首先描述了一种称为“旋转位板”的棋盘表示方法,该方法可能也适用于可持续性领域。在本文的第一部分中,我们解释了位板表示的概念以及旋转位板在走子生成中的优势。为了说明这些概念,我们描述了在FU柏林开发的C#版FUSc#象棋引擎中走子生成器的具体实现。此外,还简要讨论了旋转二进制神经网络。 第二部分讨论了计算机象棋(以及其他领域)中的强化学习。我们通过将2002-2008年FUSc#开发时的“最先进的技术”与与“阿尔法零”相关的突破性创新进行对比,举例说明了最近15-20年在这个领域所取得的进步。我们回顾了阿尔法零在其他领域中所提出的一些应用,例如像阿尔法折叠、阿尔法张量、阿尔法几何和阿尔法证明的其他阿尔法。在本文的最后一部分中,我们讨论了向绝对可持续性转变的经济模式所带来的计算机科学方面的挑战,并阐述了所谓的“进步计算机科学”需要做出哪些贡献。具体挑战包括在循环经济中通过生命周期评估来关闭材料循环,以优化绝对可持续性,并在此方向上提出了一些新的想法。
发布时间: 5/6/2025
查看原文
作者: Narmeen Oozeer, Dhruv Nathawani, Nirmalendu Prakash, Michael Lan, Abir Harrasse, Amirali Abdullah
arXiv:2503.04429v2 宣告类型: 更新 摘要:AI模型中表示通用性的研究揭示了不同领域、模态和架构之间日益趋同的趋势。然而,表示通用性的实际应用仍然很大程度上未被探索。我们通过展示一种方法来弥合这一差距,即通过学习映射其共享激活空间中的安全干预措施可以在不同模型之间进行迁移。我们在此方法上展示了两个成熟的AI安全任务:后门移除和拒绝有害提示,证明了能够成功地在模型之间转移引导向量,这些向量以可预测的方式改变模型的输出。此外,我们提出了一项新的任务,称为“受损能力”,其中模型会进行微调以嵌入与后门相关的知识。这测试了模型区分有用技能与后门的能力,反映了真实世界中的挑战。通过在Llama、Qwen和Gemma模型家族中进行广泛实验,我们展示了我们的方法使得使用较小的模型可以高效地对较大的模型进行对齐。此外,我们还展示了基础模型和微调模型之间的自动编码器映射可以作为可靠的“轻量级安全开关”,允许动态切换模型行为。
发布时间: 5/6/2025
查看原文