LLM2D

arXiv 论文列表

作者: Matth\'eo Lecrivain, Hanifa Barry, Dalila Tamzalit, Houari Sahraoui
arXiv:2503.21522v1 类型: cross 摘要:微服务架构已成为大规模云应用的事实标准,提供了可扩展性、可维护性和部署灵活性的众多好处。许多组织正在追求将遗留的大规模系统迁移到微服务架构。然而,这一过程具有挑战性、风险高、耗时长,并且容易失败,而一些组织缺乏必要的财力资源、时间或专业知识来实施这一迁移过程。因此,与其尝试迁移一个可能存在风险或不切实际的遗留系统,我们建议将其作为微服务应用进行暴露,而无需实际迁移。在本文中,我们提出了一种可重用的、自动化的两阶段方法,结合了进化算法和机器学习技术。在第一阶段,我们使用一个多目标遗传算法在方法级别识别微服务,该算法同时考虑方法之间的结构和语义依赖关系。在第二阶段,我们使用分类算法为每个识别出的微服务生成REST API,并分配HTTP方法和端点。我们使用Spring PetClinic应用的案例研究进行了评估,该应用既有大规模系统的实现也有微服务的实现,用作比较的基准。结果表明,我们的方法成功地将识别出的微服务与基准微服务实现中的微服务对齐,突显了其在服务识别和API生成方面的有效性。
发布时间: 3/28/2025
查看原文
作者: Suzukaze Kamei, Hideaki Kawaguchi, Shin Nishio, Tatakahiko Satoh
arXiv:2503.21514v1 定义类型: 横跨领域 摘要: 为评估量子计算系统相对于经典对应物的表现并探索量子优越性的可能性,我们提出了一种基于井字棋 Elo 排名的游戏解题基准。通过自动匹配中其性能与随机移动代理的对比,我们比较了经典的卷积神经网络(CNNs)、量子卷积神经网络(QCNNs)以及混合的经典-量子模型。此外,我们实现了一个集成量子通信的 QCNN,并评估其性能以量化噪声量子信道引入的开销。结果显示,经典-量子混合模型的 Elo 排名与经典 CNN 的相当,而独立的 QCNN 在当前硬件条件下表现不佳。通信开销被发现是适度的。这些发现表明,使用基于游戏的基准可以评估量子计算系统,并暗示可以以有限的性能影响将量子通信纳入其中,为未来的混合量子应用程序奠定基础。
发布时间: 3/28/2025
查看原文
作者: Yuxue Hu, Junsong Li, Meixuan Chen, Dongyu Su, Tongguan Wang, Ying Sha
arXiv:2503.21504v1 交叉公告类型: 摘要:委婉语识别解码委婉语的真实含义,例如将“weed”(委婉语)与“marijuana”(目标关键词)关联起来,应用于非法文本中,帮助内容审核并对抗地下市场。尽管现有方法主要基于文本,社交媒体的兴起强调了多模态分析的必要性,结合文本、图像和音频。然而,缺乏针对委婉语的多模态数据集限制了进一步的研究。为此,我们将委婉语及其对应的target关键词视为关键词,并首次引入了一个面向关键词的多模态委婉语语料库(KOM-Euph),涉及三个数据集(毒品、武器和性),包括文本、图像和语音。我们进一步提出了一种面向关键词的多模态委婉语识别方法(KOM-EI),该方法使用跨模态特征对齐和动态融合模块,明确利用关键词的视觉和音频特征以高效地识别委婉语。大量的实验表明,KOM-EI 超过了最先进的模型和大型语言模型,并展示了我们多模态数据集的重要性。
发布时间: 3/28/2025
查看原文
作者: Timo Budszuhn, Mark Joachim Krallmann, Daniel Horn
arXiv:2503.21495v1 类型: cross 摘要:嘈杂多目标优化面临的挑战在于在探索新决策点和通过重采样提高已知点精度之间不断权衡。这一决策应同时考虑目标函数的变异性以及当前点相对于帕累托前沿的估计。由于噪声的数量和分布通常未知,因此决策函数需要高度适应优化问题的性质。本文提出了一种通过使用置信提升和支配概率来纳入优化问题的随机性质的重采样决策函数。通过置信提升计算均值估计实现了支配概率的非参数估计。为了即使在观测值很少的情况下也能使该过程适用,我们将其他决策点观察到的分布转移到当前点。通过将该重采样方法应用于具有顺序重采样程序的NSGA-II算法并在多种噪声变化下进行测试,证明了该重采样方法的效率。
发布时间: 3/28/2025
查看原文
作者: Deependra Singh, Saksham Agarwal, Subhankar Mishra
arXiv:2503.21465v1 交叉类型: cross 摘要:我们的研究受到全球范围内大量受视网膜疾病影响的人口的迫切需求的启发,这些疾病分布均匀但缺乏专门的医疗专业知识,特别是在非城市地区。我们的主要目标是通过开发一个全面的诊断系统,仅从眼底图像中准确预测视网膜疾病来弥合这一医疗差距。然而,由于受限的、多样化的数据集和不均衡的类别分布,我们遇到了重大的挑战。为了解决这些问题,我们开发了创新策略。我们的研究引入了新颖的方法,结合了更深的卷积神经网络(CNNs)、Transformer 编码器以及串行和并行的集成架构,将20种疾病标签分为眼底图像进行分类。我们的总体目标是在实际应用中评估这些先进模型的潜力,并强烈关注提高各种条件下视网膜疾病诊断的准确性。重要的是,我们的努力超越了基线模型的结果,其中C-Tran集成模型表现最佳,获得了令人瞩目的0.9166的模型得分,超越了基线得分0.9。此外,IEViT模型的实验展示了同样令人鼓舞的结果,提高了计算效率。我们还展示了动态像素块提取和在计算机视觉任务中融合领域知识的有效性。总之,我们的研究旨在在视网膜疾病诊断领域做出重要贡献,旨在为欠发达地区的可及性医疗解决方案提供支持,并致力于进行全面和准确的疾病预测。
发布时间: 3/28/2025
查看原文
作者: Ryan Marinelli, Josef Pichlmeier, Tamas Bisztray
arXiv:2503.21464v1 Announce Type: 交叉 摘要:在本文中,我们提出了一种名为Number of Thoughts (NofT)的度量标准,以确定预提示任务的难度,并支持大规模语言模型(LLMs)在生产环境中的应用。通过基于思想的数量设置阈值,此度量标准可以区分提示的难度并支持更有效的提示路由。当通过量化和精炼版本的Deepseek(参数量分别为17亿、70亿和140亿)对MathInstruct数据集中的提示进行路由时,可以实现2%的延迟降低。此外,此度量标准还能高度有效地检测提示注入攻击中使用的对抗性提示。Number of Thoughts可以告知一个分类器,在对抗性提示检测中达到95%的准确率。我们的实验和数据集可以在我们的GitHub页面上获取:https://github.com/rymarinelli/Number_Of_Thoughts/tree/main。
发布时间: 3/28/2025
查看原文
作者: Junhao Wu, Yixin Yang, Chengxiang Jin, Silu Mu, Xiaolei Qian, Jiajun Zhou, Shanqing Yu, Qi Xuan
arXiv:2503.21463v1 类型:交叉学科 摘要:随着以太坊的广泛应用,区块链生态系统中诸如庞氏骗局之类的金融欺诈行为变得愈发猖獗,给账户资产的安全带来了重大威胁。现有的以太坊欺诈检测方法通常将账户交易建模为图,但这种方法主要关注账户间的二元交易关系,未能充分捕捉以太坊中固有的复杂多方交互模式。为解决这一问题,我们提出了一种用于以太坊庞氏骗局检测的超图建模方法,称为HyperDet。具体来说,我们将交易哈希视为超边,连接交易中涉及的所有相关账户。此外,我们设计了一种两步超图采样策略,大幅降低了计算复杂度。同时,我们引入了一种双通道检测模块,包括超图检测通道和超同图检测通道,以兼容现有的检测方法。实验结果显示,与传统的同图基检测方法相比,超同图检测通道在庞氏骗局检测中表现出显著的性能提升,证明了超图在庞氏骗局检测中的优越性。这项研究为区块链数据中复杂关系的建模提供了创新。
发布时间: 3/28/2025
查看原文
作者: Rohitash Chandra, Aryan Chaudhary, Yeshwanth Rayavarapu
arXiv:2503.21393v1 声明类型: cross 摘要:大型语言模型(LLMs)在语言翻译方面一直崭露头角,包括资源稀缺的语言。关于LLMs生成的翻译质量评估的研究相对有限,包括Gemini、GPT和谷歌翻译。在本研究中,我们通过使用对印度语言,包括梵语、泰卢固语和 Hindi 的选定LLMs进行语义和情感分析来解决这一局限性。我们选择了由专家精心翻译的文本,并使用LLMs生成它们的英文翻译,然后与选定的专家(人类)翻译进行比较。我们的发现表明,在翻译准确性方面LLMs取得了显著进步,但在保持情感和语义完整性方面仍有挑战,尤其是在比喻和哲学的背景下。情感分析显示,GPT-4o 和 GPT-3.5 在保护断章 (梵语-英语)翻译的情感方面比谷歌翻译表现更好。对于泰卢固语-英语翻译的Tamas 和 Telugu-English 的 Maha P 翻译,我们观察到了类似的趋势。在三种语言的翻译中,GPT-4o 在情感方面与 GPT-3.5 的表现相似。我们发现,与谷歌翻译相比,LLMs 在捕捉情感方面的翻译通常表现更好。
发布时间: 3/28/2025
查看原文
作者: Moncef Garouani, Josiane Mothe, Ayah Barhrhouj, Julien Aligon
arXiv:2503.21356v1 宣告类型:交叉 摘要:机器学习(ML)的快速发展导致了复杂且所谓的“黑盒”模型(如深度神经网络和集成方法)的广泛应用。这些模型展现出卓越的预测性能,使其成为社会各个领域关键决策不可或缺的工具。然而,它们固有的不透明性引发了对透明度和可解释性的担忧,使其成为不可靠的决策支持系统。为了克服这种高风险采纳的障碍,研究界的重点是开发方法来解释黑盒模型,以应对它们带来的挑战。努力集中在解释这些模型,而不是开发固有的可解释模型。然而,从一开始就设计固有的可解释模型可以为机器学习领域的负责任和有益应用铺平道路。在这份立场论文中,我们澄清了解释黑盒模型和采用固有的可解释模型之间的差距。我们强调了模型可解释性的重要性,并基于获得更好(即在预测性能方面更有效或更高效)且可靠的预测器的目的,提供了对最新混合学习方法的实验评估,这些方法将符号知识集成到神经网络预测器中。我们展示了如何使可解释的混合模型在不同领域可能取代黑盒模型。
发布时间: 3/28/2025
查看原文
作者: Ruilin Wang, Xiang Feng, Huiqun Yu, Edmund M-K Lai
arXiv:2503.21347v1 综合型:交叉 摘要:在进化多任务中,如交叉操作符和技能因子分配等策略对于有效知识转移至关重要。现有的交叉操作符改进主要集中在低维变量组合上,例如算术交叉或部分映射交叉,这些方法不足以建模复杂的高维交互。此外,静态或准动态交叉策略无法适应任务之间的动态依赖关系。另外,当前多因子进化算法框架往往依赖于固定技能因子分配策略,缺乏灵活性。为了解决这些限制,本文基于残差学习提出了多因子进化算法-残差学习(MFEA-RL)方法。该方法使用非常深的超分辨率(VDSR)模型生成个体的高维残差表示,增强对各维度内复杂关系的建模能力。基于ResNet的机制动态分配技能因子,以提高任务的适应性,而随机映射机制则有效执行交叉操作,并缓解负迁移的风险。理论分析和实验结果表明,MFEA-RL优于现有的多任务算法。它在标准的进化多任务基准测试上,包括CEC2017-MTSO和WCCI2020-MTSO,表现出色,既在收敛性上优势明显,又在适应性上表现出色。此外,其有效性还通过实际应用场景得到了验证。
发布时间: 3/28/2025
查看原文