LLM2D

arXiv 论文列表

arXiv:2504.16193v1 交叉类型:公告 摘要:背景和目的:考虑到人工智能在计算机科学领域之外的应用范围,研究人员的一个关注点是如何提供高质量的关于基于人工智能算法及其提取数据的功能解释。本研究的目的是验证系统因袭量表(I-SCS)的意大利版本,以衡量在xAI中提供的解释质量。 方法:为此,使用了2020年主要开发者协调提供的英文版本。采用正向-反向翻译方法以确保准确性。最后,通过计算内容效度指数/比值并进行典型最终用户的认知访谈,完成了这九个步骤。 结果:问卷的原始版本包含10个问题。然而,根据获得的指数(CVR低于0.49),一个问题(第8题)被完全删除。在完成上述步骤后,意大利版本包含9个问题。意大利最终用户的代表性样本完全理解了意大利版本问题的意义和内容。 结论:本研究获得的意大利版本可以在未来的研究中以及在xAI开发者领域的应用中使用。该工具可以用于衡量意大利文化中xAI系统提供的解释质量。
发布时间: 4/24/2025
查看原文
作者: Jabez Magomere, Elena Kochkina, Samuel Mensah, Simerjot Kaur, Charese H. Smiley
arXiv:2504.16188v1 类型: cross 摘要: 我们引入了FinNLI,这是一个用于金融自然语言推理(FinNLI)的基准数据集,涵盖了如SEC文件、年度报告和收益电话会议记录等多种金融文本。我们的数据集框架确保了广泛的前提-假设对,同时尽量减少了虚假的相关性。FinNLI 包含 21,304 对,其中包含 3,304 个由金融专家标注的高质量测试实例。评估结果显示,领域转移显著降低了通用领域的 NLI 性能。预训练模型(PLMs)和大型语言模型(LLMs)基线的最高宏F1分数分别为 74.57% 和 78.62%,突显了数据集的难度。令人惊讶的是,指令微调的金融语言模型表现不佳,表明其泛化能力有限。FinNLI 暴露了当前金融推理中大型语言模型的弱点,表明还需要改进的空间。
发布时间: 4/24/2025
查看原文
arXiv:2504.16173v1 类型: cross 摘要:空间任务正变得越来越雄心勃勃,这需要高性能的机载航天器计算系统。为此,现场可编程门阵列(FPGAs)由于其灵活性、成本效益以及辐射耐受性潜力而引起了广泛关注。同时,神经网络(NNs)正在被认可,因其能够执行空间任务,如自主操作、传感器数据分析和数据压缩。本文综述为希望在空间应用中实现基于FPGA的NN加速器的研究人员提供了一项有价值的资源。通过分析现有文献、识别趋势和空白,并提出未来的研究方向,本文强调了这些加速器增强机载计算系统的潜力。
发布时间: 4/24/2025
查看原文
arXiv:2504.16172v1 类型: cross 摘要: 高维偏微分方程(PDEs)在从量子化学到经济学和金融学的各个领域都构成了重大的计算挑战。尽管科学机器学习(SciML)技术提供了近似解,但它们往往存在偏差并忽视了关键的物理学原理。受语言模型推理时缩放策略的启发,我们提出了Simulation-Calibrated Scientific Machine Learning (SCaSML),这是一种基于物理的框架,在推理过程中动态地细化和去偏SciML预测,通过强制执行物理定律来实现。SCaSML利用了量化系统误差的新物理定律,并采用Feynman-Kac和Elworthy-Bismut-Li公式为基础的蒙特卡洛求解器,实现预测的动态校正。数值和理论分析证明,通过计算最优的推理方法,可以提高收敛率。我们的数值实验表明,与基础代理模型相比,SCaSML将误差减少了20-50%,确立了它是第一个在推理过程中对高维PDE的近似解进行细化的算法。SCaSML的代码可以在https://github.com/Francis-Fan-create/SCaSML获取。
发布时间: 4/24/2025
查看原文
arXiv:2504.16171v1 交叉公告类型 摘要:单光子发射计算机断层扫描(SPECT)的心肌灌注成像是一种广泛使用且成本效益高的冠状动脉疾病诊断工具。然而,这种成像过程中的长时间扫描可能会导致患者不适、运动伪影,并且由于用于衰减补偿的SPECT扫描和CT扫描之间的对齐不准确,可能导致准确性不高的诊断。减少投影角度是一种缩短扫描时间的潜在方法,但这可能会对重建图像的质量产生负面影响。为了解决这一问题,我们提出了一种专为稀疏视图MPI SPECT图像设计的深度学习检测方法。该方法结合了观察者损失项,该项惩罚人类特征的丢失,旨在提高在灌注缺陷检测任务中的性能。我们发现,在检测心肌灌注缺陷的任务中,所提出的方法获得了显著大于稀疏视图协议的受试者操作特征(ROC)曲线下的面积(AUC)。此外,我们观察到所提出的方法能够恢复左心室壁的结构,展示了克服稀疏采样伪影的能力。我们的初步结果激励对这种方法进行进一步评估。
发布时间: 4/24/2025
查看原文
arXiv:2504.16153v1 宣告类型: cross 摘要:沙特阿拉伯在2030年愿景下快速的经济增长和社会演变提供了一个独特的实时跟踪新兴趋势的机会。实时发现趋势可以为商务和投资机会开辟新的途径。本文探讨了人工智能和社会媒体分析如何在可持续性、建筑、食品饮料行业、旅游、技术和娱乐等领域发现和监控这些趋势。本文重点介绍了使用AI驱动的方法来识别沙特阿拉伯的可持续性趋势。我们处理了数百万条社交媒体帖子、新闻和博客,以了解该地区的可持续性趋势。本文提出了一种AI方法,可以帮助经济学家、企业、政府了解可持续性趋势,并在这些趋势上做出更好的决策。这种方法提供了特定领域和跨领域见解,为决策者提供了沙特阿拉伯市场变化的可靠、及时的概览。超越沙特阿拉伯,该框架还展示了适应其他地区的潜力。总体而言,我们的研究结果突显了如何通过使用AI方法,为决策者提供一种可靠的了解公共如何看待并采用倡议的方法,并了解趋势的增长。
发布时间: 4/24/2025
查看原文
作者: Mohammad Molaee, Nasrollah Moghadam Charkari
arXiv:2504.16152v1 宣告类型: cross 摘要:药物发现需要大量的时间和成本。计算药物-靶标相互作用预测是这一过程中的一个重要部分,可以通过缩小湿实验室实验的搜索空间来减少这些要求。在这篇综述中,我们提供了基于图机器学习方法在预测药物-靶标相互作用方面的综合细节,因为这些方法在这一领域表现出了令人欣喜的结果。这些细节包括整体框架、主要贡献、数据集及其源代码。所选论文主要发表于2020年至2024年。在讨论论文之前,我们简要介绍了这些方法通常使用的数据集及其评估性能的度量标准。最后,讨论了未来面临的挑战以及需要探索的一些关键领域。
发布时间: 4/24/2025
查看原文
作者: Danial Hooshyar, Gustav \v{S}\'ir, Yeongwook Yang, Eve Kikas, Raija H\"am\"al\"ainen, Tommi K\"arkk\"ainen, Dragan Ga\v{s}evi\'c, Roger Azevedo
arXiv:2504.16148v1 交叉领域声明类型 摘要:尽管在AI驱动的教育系统方面取得了显著进展,并持续呼吁负责任的AI在教育中的应用,但仍存在几个关键问题——这些问题成为教育AI、学习分析、教育数据挖掘、学习科学和教育心理学社区中的隐形大象。这一关键分析识别并探讨了九个持续存在的挑战,这些挑战继续削弱当前AI方法和在教育中的应用的公平性、透明度和有效性。这些问题包括:(1)对教育AI的真正含义缺乏清晰定义——经常忽视不同AI家族的独特目的、优势和局限性,并将其与领域通用的公司驱动的大语言模型等同;(2)对动机、情感和(元)认知等重要学习过程的关注不足,以及这些过程的上下文特性在AI驱动的学习者建模中的忽视;(3)知识领域整合不足,利益相关者在AI设计和开发中的参与度不足;(4)继续在时间序列教育数据上使用非序列化机器学习模型;(5)使用非序列化指标来评估序列化模型;(6)使用不可靠的可解释AI方法来解释黑盒模型;(7)在处理模型训练中的数据不一致性时忽视伦理准则;(8)在没有系统基准测试的情况下,使用主流AI方法进行模式发现和学习分析;(9)过分强调普遍处方,忽视了个性化、针对学生的建议。基于理论和实证研究,我们证明了混合AI方法——特别是神经符号AI——如何解决这些问题,并作为构建负责任和可信赖的教育AI系统的基础。
发布时间: 4/24/2025
查看原文
作者: Jingchao Wang, Hong Wang, Wenlong Zhang, Kunhua Ji, Dingjiang Huang, Yefeng Zheng
arXiv:2504.16145v1 类别: cross 摘要: 多任务视觉定位(MTVG)包括两个子任务,即引用表达理解(REC)和引用表达分割(RES)。现有的代表性方法通常遵循主要由三个核心步骤组成的研究管道,包括分别对视觉和语言模态进行独立特征提取,跨模态交互模块,以及为不同子任务的独立预测头部。尽管这些方法取得了显著的性能,但这一研究线程存在两个局限性:1) 语言内容尚未完全注入整个视觉骨干中,以增强更有效的视觉特征提取,需要额外的跨模态交互模块;2) REC 和 RES 任务之间的关系尚未被充分利用,以帮助协作预测以获得更准确的输出。为了解决这些问题,本文提出了一个用于多任务视觉定位的逐步语言导向视觉学习框架,称为PLVL,该框架不仅精细挖掘视觉模态自身的固有特征表达,还逐步注入语言信息以帮助学习与语言相关的视觉特征。通过这种方式,我们的PLVL无需额外的跨模态融合模块,同时全面引入了语言指导。此外,我们分析表明,REC 的定位中心在一定程度上有助于识别 RES 所需分割的对象区域。受到这一研究的启发,我们设计了一个多任务头来完成这两个子任务的协作预测。在几个基准数据集上进行的广泛实验全面证明了我们的PLVL在REC和RES任务中明显优于代表性方法。https://github.com/jcwang0602/PLVL
发布时间: 4/24/2025
查看原文
作者: Ahmed El Fekih Zguir, Ferda Ofli, Muhammad Imran
arXiv:2504.16144v1 公告类型: cross 摘要:自然灾害常常会导致社交媒体活动激增,包括求助请求、援助提案、情绪表达以及一般更新。为了使人道主义组织能够更有效地作出响应,我们提出了一种精细的层次分类体系,系统地将与求助和援助提案相关的危机信息划分为三个关键维度:物资、紧急人员和行动。利用大型语言模型(LLMs)的能力,我们引入了查询特定的少样本学习(QSF 学习)方法,从嵌入数据库中检索特定类别的带标签示例,以提高模型在检测和分类帖子方面的性能。超越分类,我们评估消息的可操作性,以优先处理需要立即关注的帖子。广泛的实验证明,我们的方法比基线提示策略更胜一筹,能够有效地识别和优先处理可操作的求助和援助提案。
发布时间: 4/24/2025
查看原文