LLM2D

arXiv 论文列表

arXiv:2409.12249v1 公告类型: 交叉 摘要: 无示例计数旨在无需密集的对象或示例注释即可计数感兴趣的对象。为此,我们提出了门控上下文感知Swin-UNet(GCA-SUN),直接将输入图像映射到可计数对象的密度图。具体而言,在编码器中设计了门控上下文感知调制模块,通过门机制抑制无关对象或背景,并通过自相似矩阵利用感兴趣对象的注意力支持。门策略还集成到瓶颈网络和解码器中,以突出与感兴趣对象最相关的特征。通过显式利用可计数对象之间的注意力支持并借助门机制消除无关特征,所提出的GCA-SUN专注于并计数感兴趣的对象,而无需依赖预定义的类别或示例。在FSC-147和CARPK数据集上的实验结果表明,GCA-SUN优于现有最先进的方法。
发布时间: 9/20/2024
查看原文
arXiv:2409.12737v1 公告类型: 交叉 摘要: 当前的跨语言句子编码器预训练方法仅使用句子级目标。这可能导致信息的丢失,尤其是对于词元,从而降低句子表示的质量。我们提出了一种名为MEXMA的新方法,该方法结合了句子级和词元级目标。使用一种语言的句子表示来预测另一种语言中的掩码词元,同时句子表示和所有词元直接更新编码器。我们的研究表明,添加词元级目标显著提高了多个任务中的句子表示质量。我们的方法在双文本挖掘以及多个下游任务中优于当前的跨语言句子编码器预训练方法。我们还分析了我们的词元中编码的信息,以及句子表示如何从这些词元中构建。
发布时间: 9/20/2024
查看原文
arXiv:2409.12244v1 公告类型: 交叉 摘要: 利用电子显微镜图像对材料进行表征,由于纳米材料结构的复杂性,给自动化标注带来了重大挑战。为此,我们引入了一个全自动的端到端流程,利用生成式人工智能的最新进展。该流程旨在分析和理解半导体材料的微观结构,其有效性可与人类专家相媲美,有助于在纳米材料识别领域追求人工通用智能(AGI)。我们的方法结合了大型多模态模型(如GPT-4V)和文本到图像模型(如DALLE-3)。我们整合了GPT-4引导的视觉问答(VQA)方法来分析纳米材料图像,通过DALLE-3生成合成纳米材料图像,并利用GPT-4V中的少样本提示进行上下文学习,以实现准确的纳米材料识别。我们的方法通过提高纳米材料识别的精度和优化高通量筛选过程,超越了传统技术。
发布时间: 9/20/2024
查看原文
arXiv:2409.12730v1 公告类型: 交叉 摘要: 从隐式反馈中学习用户偏好是推荐系统中的核心挑战之一。难点在于隐式反馈中可能存在的噪声。因此,近年来提出了各种去噪推荐方法。然而,大多数方法过于依赖超参数配置,不可避免地导致模型适应性和泛化性能的不足。在本研究中,我们提出了一种新的自适应集成学习(AEL)用于去噪推荐,该方法采用稀疏门控网络作为大脑,选择合适的专家来为不同数据样本合成适当的去噪能力。为了解决集成学习中模型复杂性的缺点并确保子推荐器的多样性,我们还提出了一种新的方法,通过堆叠组件来创建子推荐器,而不是直接构建它们。在各种数据集上的广泛实验表明,AEL在各种流行指标上优于其他方法,即使在存在大量动态噪声的情况下也是如此。我们的代码可在https://github.com/cpu9xx/AEL获取。
发布时间: 9/20/2024
查看原文
arXiv:2409.12213v1 公告类型: 交叉 摘要: 随着物联网(IoT)等技术的迅速发展,全球数据格局呈指数级增长,推动DNA存储成为当代云存储应用的潜在媒介。本文提出了一种语义增强型DNA存储(SemAI-DNA)范式,通过以下两个关键改进区别于现有的深度学习方法:1)在编码端嵌入语义提取模块,实现对细微语义信息的精细编码和存储;2)在解码端设计前瞻性多读过滤模型,利用DNA分子的固有多拷贝特性增强系统容错能力,并结合策略优化的解码器架构框架。数值结果表明,SemAI-DNA的有效性,相比传统深度学习方法,峰值信噪比(PSNR)提高了2.61dB,结构相似性指数(SSIM)提高了0.13。
发布时间: 9/20/2024
查看原文
arXiv:2409.12726v1 公告类型: 交叉 摘要: 确保云环境的安全对于维持组织增长和运营效率至关重要。随着云服务的普及度持续上升,网络威胁的不可避免性突显了预防性检测的重要性。本文介绍了一种开创性的基于时间嵌入的方法,用于基于云服务图的异常检测(CS-GAD),利用图神经网络(GNN)来识别用户在与云服务交互过程中的异常行为。我们的方法采用动态三部图表示法,封装了云服务、用户及其活动随时间变化的交互关系。通过在每个时间框架中利用GNN模型,我们的方法生成了一个图嵌入,其中每个用户根据其历史活动被分配一个分数,从而便于识别异常行为。结果显示,与现有方法相比,误报率显著降低(2-9%),同时真阳性率表现出色(100%)。这项工作的贡献包括早期检测能力、低误报率、创新的三部图表示法结合了操作类型、引入了一个包含各种用户攻击的新云服务数据集,以及一个开源实现,以促进社区在推进云服务安全方面的合作。
发布时间: 9/20/2024
查看原文
稀疏激活的混合专家模型(MoE)在扩展大型语言模型(LLMs)方面越来越受欢迎,且不会导致计算成本激增。尽管取得了成功,当前的设计面临一个挑战,即所有专家的规模相同,限制了令牌选择最适合生成下一个令牌的专家规模的能力。本文提出了一种新的MoE架构——多样规模专家混合模型(MoDSE),其层设计包含不同规模的专家。我们对困难令牌生成任务的分析表明,不同规模的专家能够实现更好的预测,并且在训练周期后,专家的路由路径趋于稳定。然而,专家规模多样性可能导致工作负载分布不均。为解决这一局限性,我们引入了一种专家对分配策略,以在多个GPU上均匀分配工作负载。在多个基准上的综合评估显示,MoDSE的有效性,它在保持总参数规模和专家数量不变的情况下,通过自适应地将参数预算分配给专家,优于现有的MoE。
发布时间: 9/20/2024
查看原文
arXiv:2409.12209v1 公告类型: 交叉 摘要: 全球胃癌病例的激增促使人们研究肠道微生物群作为该疾病的预测标志物的潜力。肠道多样性的改变被怀疑与胃癌风险的增加有关。本文深入探讨了肠道微生物群与胃癌之间的关联,重点关注接受全胃切除和次全胃切除的患者。利用数据挖掘和统计学习方法,对96名参与者的16S-RNA测序基因进行了分析,旨在识别与胃癌相关的特定肠道微生物属。研究发现了几种可能作为胃癌风险评估生物标志物的显著细菌属。这些发现为胃癌的早期风险评估和预防措施提供了途径。这些肠道微生物影响胃癌进展的复杂机制值得进一步研究。本研究旨在显著促进对肠道-癌症轴及其在疾病预测和预防中的意义的理解。
发布时间: 9/20/2024
查看原文
arXiv:2409.12720v1 公告类型: 交叉 摘要: 6D物体姿态估计涉及确定物体在场景中的三维平移和旋转,并相对于选定的坐标系进行定位。这一问题在许多工业任务中尤为重要,如质量控制、料箱拣选和机器人操作,这些应用中速度和精度对于实际部署至关重要。当前的模型,无论是经典的还是基于深度学习的,通常在精度和延迟之间难以平衡。我们的研究专注于提升一种先进的深度学习模型GDRNPP的速度,同时保持其高精度。我们采用了多种技术来减小模型尺寸并提高推理时间,包括使用更小、更快的骨干网络,修剪不必要的参数,以及通过蒸馏将知识从大型高性能模型转移到更小、更高效的学生模型。我们的研究结果表明,所提出的配置在保持与最先进技术相当的精度的同时,显著提高了推理时间。这一进展可能会在各种工业场景中实现更高效和实用的应用,从而增强6D物体姿态估计模型在实际环境中的整体适用性。
发布时间: 9/20/2024
查看原文
arXiv:2409.12197v1 公告类型: 交叉 摘要: 人工智能(AI)在健康领域的应用有潜力显著改变和提升医疗保健。然而,在大多数非洲国家,如何识别与文化和情境相适应的解决方案部署方法尚未得到充分理解。为了填补这一空白,我们进行了一项定性研究,以探讨在非洲国家部署健康AI时的最佳实践、公平性指标和潜在偏见,以及探索人工智能在健康领域可能带来的积极影响。我们采用了混合方法,结合了深度访谈(IDIs)和问卷调查。我们与来自17个国家的50位健康、政策和AI领域的专家进行了1.5至2小时的IDIs,并通过归纳法对专家的IDI回答进行了定性主题分析。我们还对非洲5个国家的672名普通民众进行了盲测30分钟的问卷调查,并分析了他们在定量尺度上的回答,统计比较了不同国家、年龄、性别和对AI熟悉程度的回答。我们主题性地总结了问卷中的开放式回答。我们的研究结果发现,普通民众对非洲健康AI的使用普遍持积极态度,信任度高,但也有适度的担忧。这与专家的回答形成对比,专家的主要主题围绕信任/不信任、伦理问题和系统性障碍等问题。这项工作首次从算法公平性的角度,对非洲健康AI的潜力进行了定性研究,涵盖了专家和普通民众的观点。我们希望这项工作能够指导政策制定者,并强调进一步研究和在AI使用决策中纳入普通民众观点的必要性。
发布时间: 9/20/2024
查看原文