LLM2D

arXiv 论文列表

作者: Vikas Kushwaha, Sruti Srinivasa Ragavan, Subhajit Roy
arXiv:2503.21615v2 宣告类型: replace-cross 摘要:成功的代理-人类伙伴关系要求任何由代理生成的信息对人类来说是可理解的,并且人类能够轻松地引导代理朝着目标前进。这种有效的沟通要求代理发展出更细致的人类可理解性概念。目前最先进的代理,包括大型语言模型(LLMs),缺乏这种详细的可理解性概念,因为它们只能从训练数据中捕捉到平均的人类感受性,因此提供了有限的可控性(例如,需要复杂的提示工程)。 在本文中,我们不仅依赖数据,而是主张开发通用的、跨领域的可理解性度量标准,这些度量标准可以作为这些代理的指令。现有的关于可理解性度量的研究是分散的,我们在不同领域回顾了各种这样的努力,并为未来的更连贯且跨领域的研究奠定了认知科学基础。
发布时间: 4/24/2025
查看原文
作者: Runzhi Wang, Prianka Sengupta, Cristhian Roman-Vicharra, Yiran Chen, Jiang Hu
arXiv:2503.11662v2 公告类型: replace-cross 摘要:在芯片设计规划中,获得各种设计选项的可靠性能和功耗预测至关重要。传统的方法通常需要使用系统级模型,这些模型往往缺乏准确性,或者需要进行试 synthesis,这既费时又费力。我们介绍了一种新的方法论,称为 Lorecast,该方法接受英文提示作为输入,以快速生成版图感知的性能和功耗估算。这种方法绕过了 HDL 代码开发和 synthesis 的需要,使其既快速又用户友好。实验结果表明,Lorecast 的预测误差在几百分点范围内与后版图分析一致,同时显著减少了周转时间。
发布时间: 4/24/2025
查看原文
作者: Han Xue, Jieji Ren, Wendi Chen, Gu Zhang, Yuan Fang, Guoying Gu, Huazhe Xu, Cewu Lu
arXiv:2503.02881v3 宣告类型: replace-cross 摘要:人类可以利用视觉和触觉来完成复杂的接触性任务,具备快速应对外部变化的高反应能力以及对接触力的自适应控制;然而,这对机器人来说仍然是一个挑战。现有的视觉模仿学习(IL)方法依赖于动作分块来建模复杂的行为,但在分块执行过程中无法实时响应触觉反馈。此外,大多数远程操作系统在提供细粒度的触觉/力反馈方面存在困难,这限制了可执行的任务范围。为了解决这些挑战,我们引入了 TactAR,这是一个低成本的远程操作系统,通过增强现实(AR)提供实时触觉反馈,并结合了一种新型的两阶段视觉-触觉模仿学习算法——反应扩散策略(RDP),用于学习复杂的接触性操作技能。RDP 采用两层层次结构:(1)低频的慢速潜在扩散策略,用于在潜在空间中预测高层动作分块;(2)高频的非对称标记器,用于闭环触觉反馈控制。这种设计能够在统一框架中实现复杂的轨迹建模和快速的反应行为。通过在三个具有挑战性的接触性任务上的广泛评估,RDP 显著提高了与最先进的视觉 IL 基线相比的表现。此外,实验结果表明,RDP 在不同类型的触觉/力传感器上都是适用的。代码和视频可在 https://reactive-diffusion-policy.github.io 获取。
发布时间: 4/24/2025
查看原文
作者: Majid Farhadloo, Arun Sharma, Mingzhou Yang, Bharat Jayaprakash, William Northrop, Shashi Shekhar
arXiv:2502.15013v3 宣告类型: replace-cross 摘要:传统的基础模型在广泛的 dataset 上进行预训练,以减少对各种下游任务进行微调所需的训练资源(例如,时间、能量、带标签样本)。然而,传统的基础模型在处理离分布预测时存在困难,并且可能会生成不现实且物理上不可能的输出。我们提出了物理引导的基础模型(PGFM)的概念,即结合了广泛或通用领域(例如,科学)物理知识的基础模型,这些知识适用于各种下游任务。
发布时间: 4/24/2025
查看原文
作者: Priyaranjan Pattnayak, Hitesh Laxmichand Patel, Amit Agarwal, Bhargava Kumar, Srikant Panda, Tejaswini Kumar
arXiv:2502.13108v2 任务类型: replace-cross 摘要:临床问题回答(CQA)在医疗决策中发挥着至关重要的作用,使医生能够从电子医疗记录(EMRs)中提取相关信息。虽然基于转换器的模型如BERT、BioBERT和ClinicalBERT在CQA中展现了最先进的性能,但现有的模型缺乏提取答案分类的能力,这对于结构化检索、内容过滤和医疗决策支持至关重要。 为了解决这一局限性,我们引入了一个多任务学习(MTL)框架,联合训练CQA模型,用于答案提取和医疗分类。除了预测答案片段外,我们的模型将响应分类为五个标准化的医疗类别:诊断、药物、症状、程序和实验室报告。这种分类使得输出更加结构化和可解释,从而使得临床QA模型在实际医疗环境中更具用处。 我们在emrQA上评估了我们的方法,这是一个针对医疗问题回答的大规模数据集。结果显示,与标准微调相比,MTL在F1分数上提高了2.2%,并且在答案分类上的准确率达到90.7%。这些发现表明,MTL不仅提升了CQA性能,还引入了一种有效的分类和结构化医疗信息检索机制。
发布时间: 4/24/2025
查看原文
作者: Zihang Cheng, Huiping Zhuang, Chun Li, Xin Meng, Ming Li, Fei Richard Yu, Liqiang Nie
arXiv:2502.10475v2 通报类型: replace-cross 摘要: 3D高斯散点图(3DGS)被广泛应用于3D重建和3D生成中。训练一个3DGS场景往往需要大量的时间和资源,甚至有价值的灵感。随着3DGS数字资产的不断增加,版权保护带来了巨大的挑战。然而,针对3DGS的深入研究仍然不足。在本文中,我们提出了一种新的框架X-SG$^2$S,可以在几乎不改变原始3DGS场景的情况下同时水印1到3D消息。一般而言,我们有一个X-SG$^2$S注入器用于同时添加多模消息,以及一个提取器用于提取它们。具体来说,我们首先以固定方式将水印分成消息块,并对3DGS点进行排序。使用自适应门挑选出适合水印的位置。然后使用XD(多维)注入头将多模消息添加到排序后的3DGS点中。可学习的门可以识别带有额外消息的位置,而XD提取头可以从可学习门推荐的位置中恢复隐藏的消息。广泛的实验表明,提出的X-SG$^2$S可以在不改变预训练的3DGS管道或原始3DGS参数形式的情况下有效地隐藏多模消息。同时,由于其简单的高效模型结构和高度的实用性,X-SG$^2$S在隐藏和提取多模结构化或非结构化消息方面仍表现出良好的性能。X-SG$^2$S是第一个统一1到3D水印模型的成果,也是第一个在单个3DGS中同时添加多模水印的框架,为后续研究铺平了道路。
发布时间: 4/24/2025
查看原文
arXiv:2501.10100v2 宣告类型: replace-cross 摘要:学习健壮且泛化的世界模型对于实现现实环境中高效可扩展的机器人控制至关重要。在本工作中,我们提出了一个新颖的框架,以准确捕捉复杂、部分可观测和随机动力学。所提出的方法采用了双自回归机制和自我监督训练,以实现可靠的长期预测,而无需依赖领域特定的归纳偏见,从而确保在多样化的机器人任务中具有适应性。我们还提出了一种策略优化框架,该框架利用世界模型在想象环境中的高效训练,并在现实世界的系统中无缝部署。通过解决长期预测、误差累积和从仿真到现实世界的迁移等挑战,本工作推进了基于模型的强化学习。通过提供可扩展且健壮的框架,引入的方法为实际应用中的自适应和高效机器人系统铺平了道路。
发布时间: 4/24/2025
查看原文
作者: Leonard Pu\v{s}k\'a\v{c}, Marek Benovi\v{c}, Jakub Breier, Xiaolu Hou
arXiv:2501.00798v2 通知类型: 交叉替换 摘要:嵌入式设备中实现的神经网络模型已被证明容易受到侧信道攻击(SCAs),这允许恢复专有模型参数,如权重和偏置。目前已经存在的一些用于保护密码实现的防御方法可以针对嵌入式神经网络模型进行调整。Shuffling,一种基于遮蔽的防御措施,通过随机打乱计算顺序来隐藏信息,在使用Fish-Yates算法时已被证明对SCA是脆弱的。在本文中,我们提出了一种Fish-Yates算法的SCA安全版本的设计。通过集成模数减法的屏蔽技术与Blakely的方法进行模数乘法,我们有效地消除了原算法中导致侧信道泄漏的除法操作的脆弱性。通过在ARM Cortex-M4上实现嵌入式神经网络模型,并对其实施数值相关性功率分析攻击,我们实验性地评估了该防御措施对SCA的有效性。与原始提案相比,该防御措施的内存开销是网络最大层的两倍,而时间开销在具有100个和1000个神经元的层中分别从4%变化到0.49%。
发布时间: 4/24/2025
查看原文
arXiv:2412.13612v3 Announce Type: replace-cross 摘要:大规模语言模型(LLMs)已经作为一种潜在的解决方案出现,用于自动化撰写文献综述所涉及的复杂过程,例如文献收集、组织和总结。然而,目前尚不清楚LLMs在自动化全面可靠的文献综述方面做得有多好。本研究提出了一个框架,用于自动评估LLMs在文献撰写三大关键任务上的表现:参考生成、文献总结和文献综述编撰。我们引入了多维度的评估指标,这些指标评估生成的参考文献中虚构率,并测量文献总结和编撰的语义覆盖和事实一致性与其相应的人工撰写版本之间的差异。实验结果表明,即使是最先进的模型在生成参考文献时仍会产生虚构内容,尽管近期有所进步。此外,我们观察到,在撰写文献综述方面,不同模型在不同学科的表现存在差异。这些发现强调了进一步研究和开发的重要性,以提高LLMs在自动化学术文献综述方面的可靠性。
发布时间: 4/24/2025
查看原文
作者: Bao-Bing Li, Yi Gu, Shao-Feng Wu
arXiv:2412.12161v2 宣告类型: replace-cross 摘要:机器学习可以揭示物理概念或物理方程,前提是在另一方面的先验知识是可用的。然而,这两方面通常是交织在一起的,不能独立地被发现。我们通过提出结合变分自编码器(VAE)和神经常微分方程(Neural ODEs)的模型,扩展了SciNet。SciNet是一种模拟人类物理推理过程的神经网络架构,用于物理学发现。这使得我们能够同时从不同物理系统的模拟实验数据中发现物理概念和控制方程。我们将该模型应用于几位物理史上启发的例子,包括哥白尼的日心说、牛顿的万有引力定律、薛定谔的波动力学以及泡利的自旋-磁性描述。结果表明,在神经网络中可以涌现正确的物理理论。
发布时间: 4/24/2025
查看原文