LLM2D

arXiv 论文列表

作者: Josef Koumar, Karel Hynek, Tom\'a\v{s} \v{C}ejka, Pavel \v{S}i\v{s}ka
网络流量异常检测对于维护计算机网络安全和识别恶意活动至关重要。基于预测的方法是异常检测的主要方法之一。然而,缺乏用于预测和异常检测技术的真实世界网络数据集,可能会导致异常检测算法性能过高估计。本文通过引入一个包含网络实体行为时间序列数据的数据集来解决这一差距,该数据集从 CESNET3 网络收集而来。该数据集由 275,000 个活跃 IP 地址的 40 周网络流量创建。该数据来自互联网服务提供商,确保网络实体之间具有高度的变异性,这为预测和异常检测模型带来了独特的真实挑战。它为基于预测的异常检测方法的实际部署提供了宝贵的见解。
发布时间: 9/30/2024
查看原文
作者: Alexey Tikhonov, Lisa Bylinina, Ivan P. Yamshchikov
我们展示了语言和视觉模型 CLIP 与两个纯文本模型 FastText 和 SBERT 在编码个体化信息方面的差异。我们研究了 CLIP 为基底、颗粒聚集体和不同数量的对象提供的潜在表示。我们证明,与仅在文本数据上训练的模型相比,CLIP 嵌入更好地捕捉了个体化的量化差异。此外,我们从 CLIP 嵌入中推断出的个体化层次结构与语言学和认知科学中提出的层次结构一致。
发布时间: 9/30/2024
查看原文
作者: William E. R. de Amorim, Scott A. Sisson, T. Rodrigues, David J. Nott, Guilherme S. Rodrigues
位置编码图神经网络 (PE-GNN) 是用于对连续空间数据建模的一种领先方法。然而,它们通常无法生成校准的预测分布,从而限制了其在不确定性量化方面的有效性。我们介绍了位置编码图分位数神经网络 (PE-GQNN),这是一种新方法,它在完全非参数框架中集成了 PE-GNN、分位数神经网络和重新校准技术,对预测分布的假设最少。我们提出了一种新的网络架构,它与基于分位数的损失函数相结合,可以产生准确可靠的概率模型,而不会增加计算复杂度。我们的方法为条件密度估计提供了一个灵活、稳健的框架,适用于除空间数据上下文之外的应用。我们还介绍了一种结构化方法,用于将 KNN 预测器纳入模型,同时避免通过 GNN 层操作导致数据泄露。对基准数据集的实验表明,PE-GQNN 在预测精度和不确定性量化方面都显著优于现有的最先进方法。
发布时间: 9/30/2024
查看原文
作者: Kuo-Hsuan Hung, Kuan-Chen Wang, Kai-Chun Liu, Wei-Lun Chen, Xugang Lu, Yu Tsao, Chii-Wann Lin
心电图 (ECG) 是一种重要的非侵入性心血管疾病诊断方法。然而,ECG 信号容易受到噪声污染,例如电干扰或信号漂移,这会降低诊断准确性。尽管已经提出了各种 ECG 降噪方法,但大多数现有方法在高噪声条件下表现不佳,或者在推理过程中需要多个步骤,从而导致在线处理过程中的延迟。本文提出了一种新颖的 ECG 降噪模型,即基于 Mamba 的 ECG 增强器 (MECG-E),它利用 Mamba 架构,该架构以其快速推理和出色的非线性映射能力而闻名。实验结果表明,MECG-E 在不同噪声条件下,在多个指标上都超越了几个知名的现有模型。此外,与最先进的基于扩散的 ECG 降噪器相比,MECG-E 需要更少的推理时间,证明了该模型的功能和效率。
发布时间: 9/30/2024
查看原文
作者: Sajjad Aghasi Javid, Mahmood Mohassel Feghhi
众所周知,阿尔茨海默病 (AD) 是全球最常见的痴呆症病因。这种疾病从轻度到重度逐渐加重,干扰人们的日常生活。早期诊断对于患者护理和临床试验至关重要。卷积神经网络 (CNN) 用于创建框架,从 MRI 扫描中识别特定疾病特征。痴呆症的分类涉及诸如病史回顾、神经心理测试和磁共振成像 (MRI) 等方法。然而,从 Kaggle 获得的图像数据集面临着严重的类别不平衡问题,需要对来自每个类别的样本进行均衡分布以解决这一问题。本文为了解决这种不平衡,采用了合成少数过采样技术 (SMOTE)。此外,将预训练的卷积神经网络应用于 DEMNET 痴呆症网络,以提取 AD 图像的关键特征。所提出的模型实现了令人印象深刻的 98.67% 的准确率。
发布时间: 9/30/2024
查看原文
作者: Hamed Babaei Giglou, Jennifer D'Souza, S\"oren Auer
针对日益复杂和庞大的科学文献,本文提出了 LLMs4Synthesis 框架,旨在增强大型语言模型 (LLMs) 在生成高质量科学综述方面的能力。该框架旨在快速、连贯且上下文丰富的整合科学见解,并利用开源和专有 LLMs。它还考察了 LLMs 在评估这些综述的完整性和可靠性方面的有效性,弥补了当前定量指标的不足。我们的研究通过开发一种新颖的科学论文处理方法、定义新的综述类型以及建立九项详细的综述质量评估标准,为该领域做出了贡献。建议将 LLMs 与强化学习和 AI 反馈相结合,以优化综述质量,确保其与既定标准保持一致。LLMs4Synthesis 框架及其组件已公开发布,有望提高科学研究综述的生成和评估过程。
发布时间: 9/30/2024
查看原文
本研究运用增强型 BERTopic 模型分析,探讨了 2023 年亚运会电竞项目的公众意见以及赛事期间的价值共创。我们识别出代表公众认知的五个主要主题,以及主要利益相关者如何在电竞生态系统内及之外共同创造价值。主要发现强调了社交媒体营销在影响公众舆论和推广电竞赛事和品牌方面的战略性作用,突出了赛事物流和基础设施的重要性。此外,研究揭示了传统电竞生态系统之外的利益相关者所贡献的共同创造价值,特别是在促进国家代表性和表现方面。我们的发现支持了将电竞合法化为一项运动的持续努力,并指出主流认可仍然是一个挑战。将电竞列为奖牌项目展示了更广泛的接受度,并有助于减轻负面公众认知。此外,非传统利益相关者的贡献强调了跨亚文化合作在电竞中的价值。
发布时间: 9/30/2024
查看原文
本文提出了一种利用神经网络和视频分析提高奶牛乳腺炎风险评估准确性的方法。乳腺炎是乳房组织感染,是奶牛的重大健康问题,可以通过检查奶牛的乳头来检测。传统上,兽医在挤奶过程中评估奶牛乳头的健康状况,但这种方法时间有限,可能会降低评估的准确性。在商业化农场中,奶牛在挤奶厅挤奶时会被摄像头记录。本文使用神经网络识别记录的视频中奶牛乳房完好无损的关键帧。这些关键帧允许兽医有更多的时间灵活地对乳头进行健康评估,从而提高他们的效率和准确性。然而,使用奶牛乳头视频进行乳腺炎风险评估存在挑战,例如环境复杂、奶牛位置和姿势变化以及难以从视频中识别乳房。为了解决这些挑战,本文提出了一种融合距离和集成模型来提高从奶牛乳头视频中识别关键帧的性能(F 分数)。结果表明,与使用单个距离度量或模型相比,这两种方法都提高了性能。
发布时间: 9/30/2024
查看原文
作者: Seyed Mohammad Azimi-Abarghouyi, Nicola Bastianello, Karl H. Johansson, Viktoria Fodor
本文抛弃了广泛使用的基于梯度下降的分层联邦学习 (FL) 算法,提出了一种基于交替方向乘子法 (ADMM) 的新型分层 FL 框架。在此框架内,我们提出了两种新颖的 FL 算法,它们都在顶层使用 ADMM:一种在底层使用 ADMM,另一种使用传统的基于梯度下降的方法。该框架增强了隐私,实验表明,与传统算法相比,所提出的算法在学习收敛和准确性方面具有优越性。此外,即使局部步骤数量非常有限,底层的梯度下降也能表现良好,而两层的 ADMM 则在其他情况下表现更好。
发布时间: 9/30/2024
查看原文
作者: Siheng Li, Cheng Yang, Taiqiang Wu, Chufan Shi, Yuji Zhang, Xinyu Zhu, Zesen Cheng, Deng Cai, Mo Yu, Lemao Liu, Jie Zhou, Yujiu Yang, Ngai Wong, Xixin Wu, Wai Lam
诚实是将大型语言模型 (LLM) 与人类价值观相一致的基本原则,要求这些模型能够识别它们知道什么和不知道什么,并能够忠实地表达它们的知识。尽管前景光明,但目前的 LLM 仍然表现出明显的欺骗行为,例如自信地给出错误答案或无法表达它们所知道的。此外,关于 LLM 诚实性的研究也面临着挑战,包括诚实定义的差异、区分已知和未知知识的困难以及对相关研究缺乏全面理解。为了解决这些问题,我们对 LLM 的诚实性进行了调查,涵盖了其澄清、评估方法和改进策略。此外,我们为未来的研究提供了见解,旨在激发对这一重要领域的进一步探索。
发布时间: 9/30/2024
查看原文