arXiv 论文列表

作者: Dong-Hee Paek, Seung-Hyun Kong

arXiv:2502.00074v1 Announce Type: cross 摘要：最近，4D雷达作为一种关键传感器，在自动驾驶车辆中的3D物体检测中崭露头角，提供了恶劣天气条件下稳定的感知能力和高密度点云，便于物体形状识别。然而，处理这种高密度数据需要大量的计算资源和能源消耗。我们提出了SpikingRTNH，这是第一个使用4D雷达数据进行3D物体检测的脉冲神经网络（SNN）。通过将传统的ReLU激活函数替换为漏电积分-发射（LIF）脉冲神经元，SpikingRTNH实现了显著的能源效率提升。此外，受人类认知过程的启发，我们引入了生物自顶向下的推理（BTI），该方法按从高密度到低密度的顺序处理点云。这种方法有效利用了噪声较低、重要性较高的点进行检测。在K-Radar数据集上的实验表明，SpikingRTNH结合BTI在降低能源消耗方面达到了78%，同时其探测性能与对应的ANN模型（3D AP 51.1%，BEV AP 57.0%）相当。这些结果证明了脉冲神经网络在自动驾驶系统中基于4D雷达的能源高效物体检测的可行性。所有代码可从https://github.com/kaist-avelab/k-radar获取。

发布时间: 2/4/2025

查看原文

LLM 网络评估无法捕获实际风险

作者: Kamil\.e Luko\v{s}i\=ut\.e, Adam Swanda

arXiv:2502.00072v1 类别：交叉摘要：大型语言模型（LLMs）在网络安全应用中展现出了不断增强的能力，同时也在加强防御方面带来了潜在的风险。在这篇立场论文中，我们认为当前评估这些能力带来的风险的努力与理解实际影响的目标不一致。评估LLM的网络安全风险不仅仅需要衡量模型的能力——还需要一个全面的风险评估框架，该框架需要考虑到威胁行为者采纳行为的分析及其潜在影响。我们提出了一种LLM网络安全能力的风险评估框架，并将其应用于语言模型作为网络安全助理的案例研究。对前沿模型的评估显示，合规率为高，但在现实的网络安全辅助任务上准确性适中。然而，我们提出的框架表明，由于操作优势有限和潜在影响有限，这种特定用例只带来了中等风险。基于这些发现，我们建议采取若干措施以使研究重点与实际影响评估更加一致，包括加强学术界与工业界的合作、更真实地模拟攻击者行为以及在评估中包含经济指标。这项工作代表了朝着更有效地评估和减轻由LLM带来的网络安全风险的重要一步。

发布时间: 2/4/2025

查看原文

AI能解决同行评审危机吗？一项关于LLM在评估经济学论文时表现及偏见的大规模实验

作者: Pat Pataranutaporn, Nattavudh Powdthavee, Pattie Maes

arXiv:2502.00070v1 交叉发布类型: cross 摘要: 通过使用大规模语言模型（LLM）分析9030篇独特的9030份提交的27,090份评估，我们探讨了人工智能是否能解决经济学中的同行评议危机。实验系统地变化了作者特征（如隶属关系、声望、性别）和出版质量（如顶级期刊、次级期刊、低级期刊、AI生成的文章）。结果表明，LLM能够有效地区分文章质量，但表现出偏向著名机构、男性作者和著名经济学家的偏见。此外，LLM难以区分高质量的AI生成的文章与真正顶级期刊的提交。虽然LLM提供了效率提升，但它们的偏见倾向需要谨慎整合，并采用混合同行评议模式以平衡公平性和准确性。

发布时间: 2/4/2025

查看原文

电动汽车充电位置的隐私保护预测

作者: Robert Marlin, Raja Jurdak, Alsharif Abuadbba, Dimity Miller

arXiv:2502.00068v1 交叉类型摘要：到2050年，电动汽车（EV）预计将成为全球汽车销量的70%。虽然电动汽车提供了环境效益，但它们也带来了能源生成、电网基础设施和数据隐私方面的挑战。当前关于电动汽车路线规划和充电管理的研究往往在预测能源需求时忽略了隐私问题，导致敏感的移动数据面临风险。为了解决这一问题，我们开发了一种联邦学习变换器网络（FLTN），以增强隐私保护措施来预测电动汽车的下一个充电地点。每辆电动汽车作为客户端，训练一个部署在其上的FLTN模型，仅与社区分布式能源资源管理系统（DERMS）共享模型权重，而不共享原始数据。DERMS将这些权重聚合为一个社区全局模型。为了进一步增强隐私性，社区中的非临时电动汽车在同侪之间直接共享和增强模型权重，隐藏个体贡献并提高模型准确性。社区DERMS的全局模型权重随后重新分配给电动汽车，以实现持续训练。我们提出的方法在保持数据隐私的同时，实现了高达92%的准确性，而基准的集中式模型则达到了98%的准确性，但没有任何数据隐私。在不同充电水平下进行的模拟确认了FLTN在长时间内预测能源需求的能力。我们提出了一种面向隐私的解决方案，有效地减少了数据泄露风险。

发布时间: 2/4/2025

查看原文

多层大型语言模型框架用于疾病预测

作者: Malak Mohamed, Rokaia Emad, Ali Hamdi

arXiv:2502.00063v1 类型: cross 摘要：社交远程医疗通过使患者能够远程共享症状并接受医疗咨询而颠覆了医疗保健。用户经常在社交媒体和在线健康平台上发布症状，生成了大量的医疗数据，这些数据可以用于疾病分类和症状严重程度评估。大型语言模型（LLMs），如 LLAMA3、GPT-3.5 Turbo 和 BERT，处理复杂的医疗数据以增强疾病分类。本研究探讨了三种阿拉伯医学文本预处理技术：文本摘要、文本细化和命名实体识别（NER）。通过使用增强的命名实体识别文本，CAMeL-BERT 的性能最佳（类型分类准确率为 83%，严重程度评估准确率为 69%）。未进行微调的模型表现较差（类型分类准确率为 13%-20%，严重程度评估准确率为 40%-49%）。将 LLMs 集成到社交远程医疗系统中可以提高诊断准确性和治疗效果。

发布时间: 2/4/2025

查看原文

从数据到行动：绘制一条数据驱动的抗微生物耐药性斗争之路

作者: Qian Fu, Yuzhe Zhang, Yanfeng Shu, Ming Ding, Lina Yao, Chen Wang

arXiv:2502.00061v1 宣言类型：交叉摘要：抗菌耐药性（AMR）微生物在医疗保健中日益成为一个挑战，使现代药物变得无效。AMR 来自抗生素的生产和细菌的进化，但对其传播的量化依然困难重重。随着 AMR 相关数据的增加，数据驱动的方法提供了对其成因和治疗方法的有希望的见解。本文从数据挖掘和机器学习的角度综述了 AMR 研究，总结了最先进的技术和探讨了关键领域，如监测、预测、药物发现、管理以及驱动因素分析。它讨论了数据来源、方法和挑战，强调了标准化和互操作性。此外，它还概述了统计和机器学习技术在AMR分析中的应用，解决了数据噪声和偏差等问题。去噪和去偏策略被强调以提高AMR研究中的公平性和稳健性。文章强调了在推进AMR研究中跨学科合作和意识到数据挑战的重要性，并指出了创新和改进方法的发展方向。

发布时间: 2/4/2025

查看原文

以色列-哈马斯战争通过Telegram、Reddit和Twitter

作者: Despoina Antonakaki, Sotiris Ioannidis

arXiv:2502.00060v1 交叉类型通知摘要：巴以冲突始于2023年10月7日，迄今已导致超过48000人丧生，其中包括超过17000名儿童，其中大多数来自加沙地带，超过3万人受伤，超过1万人失踪，超过100万人流离失所，逃离冲突区域。基础设施受损包括87%的住房单位、80%的公共建筑和60%的耕地，36家医院中的17家，68%的公路网络和87%的学校建筑受损。这场冲突还引发了各种社交媒体平台上的在线讨论。由于其加密通信和高度参与的受众，电报也不例外。当前研究将涵盖与冲突各方及讨论中体现的情感相关的讨论分析。为此，我们准备了自2025年10月23日至今日在电报频道上共享的125万条消息的数据集。此外，我们还在Twitter的两个公开可用数据集中进行了同样的分析，这两个数据集分别包含2001条推文和Reddit的数据集中200万条意见。我们分别对这三个数据集进行了规模分析、实体提取，然后进行了BERT主题分析以提取常见主题或话题。接下来，我们应用情感分析来分析讨论中的情感倾向。我们的发现表明，极化的叙事是政治派系和局外人塑造公众意见的标志。我们还分析了情感-主题的频度关系，详细说明了可能表明参与方操纵和宣传企图的趋势。这将有助于更好地理解巴以冲突的在线讨论，并有助于了解在地缘政治危机期间社交媒体通信的动态。

发布时间: 2/4/2025

查看原文

大型语言模型是少量示例多变量时间序列分类器

作者: Yakun Chen, Zihao Li, Chao Yang, Xianzhi Wang, Guandong Xu

arXiv:2502.00059v1 类别: cross 摘要: 大型语言模型（LLMs）在时间序列分析中已被广泛运用。然而，在涉及多变量时间序列数据的少量样本分类（即由于工业应用中可用训练数据有限而成为一个关键的训练场景）方面的实用性仍待探索。我们旨在利用LLMs中丰富的预训练知识，克服多变量时间序列中的数据稀缺问题。具体而言，我们提出了LLMFew，这是一个LLM增强框架，用于研究LLMs在少量样本多变量时间序列分类方面的可行性和能力。该模型引入了一种斑块级时间卷积编码器（PTCEnc），将时间序列数据与LLMs的文本嵌入输入对齐。我们进一步使用低秩适应（LoRA）微调预训练的LLM解码器，以增强其在时间序列数据中的特征表示学习能力。实验结果表明，我们的模型在Handwriting和EthanolConcentration数据集中分别在分类准确性方面比最先进的基线方法高出125.2%和50.2%。此外，我们的实验结果表明，基于LLM的方法在少量样本多变量时间序列分类（few-shot MTSC）的各种数据集中表现出色，提供的结果比传统模型更可靠。这一成功为在数据有限的工业环境中部署这些方法铺平了道路。

发布时间: 2/4/2025

查看原文

作者: Ljubisa Bojic, Zorica Dodevska, Yashar Deldjoo, Nenad Pantelic

arXiv:2502.00055v1 交叉公告类型摘要：随着AI技术的指数级发展以及推荐系统潜在危害的可能升级，提前模拟和评估这些影响至关重要。这有助于防止对社会和技术公司造成可能的损害。本文介绍了推荐系统大语言模型 playground（RecSysLLMsP），这是一个利用大语言模型（LLMs）探索不同内容推荐设置对社交媒体用户参与度和极化影响的新型仿真框架。通过创建具有描述性、静态和动态属性的多样AI代理（AgentPrompts），我们在三个场景中评估了它们的自主行为：多数派、平衡和相似性。研究发现，尽管与用户偏好匹配的内容在Similarity场景下最大化了参与度，但可能促进了信息回音室。相反，Plurality场景促进了多样化的互动，但产生了混合的参与度结果。本研究强调，在推荐系统设计中应仔细平衡，以提高用户满意度同时减轻社会极化。它强调将LLMs整合到仿真环境中的独特价值和挑战。RecSysLLMsP的好处在于其潜在的能力来计算极化效应，这对于评估社会影响和确定不同推荐系统设置下的用户参与度至关重要。这种优势对于社交媒体公司的业务模式的成功开发和维护至关重要。然而，研究的局限性在于准确模拟现实的困难。未来的研究应验证AgentPrompts与真实人类行为之间的相似性，并建立衡量极化评分的度量标准。

发布时间: 2/4/2025

查看原文

对比学习与领域适应的桥梁：理论视角与实际应用

作者: Gonzalo I\~naki Quintana, Laurence Vancamberg, Vincent Jugnon, Agn\`es Desolneux, Mathilde Mougeot

arXiv:2502.00052v1 类型: cross 摘要: 本文从理论上研究了对比学习与领域适应之间的关系。两种标准的对比损失——NT-Xent损失（自监督）和监督对比损失——与领域适应中广泛使用的类内均值最大分歧度（CMMD）有关，这是一种不相似性度量。我们的工作表明，最小化对比损失可以降低CMMD，同时提高类间可分辨性，为在领域适应背景下使用对比学习奠定了理论基础。由于领域适应在医学影像中的重要性，我们将实验集中在乳腺X光片上。在三个乳腺X光片数据集——合成补丁、临床（真实）补丁和临床（真实）图像——上进行的大量实验表明，在最小化监督对比损失的情况下，领域适应、类间可分辨性和分类性能都有所提高。

发布时间: 2/4/2025

查看原文