arXiv 论文列表

SOTOPIA-S4：一个用户友好的灵活性强、可定制且规模庞大的社会模拟系统

作者: Xuhui Zhou, Zhe Su, Sophie Feng, Jiaxu Zhou, Jen-tse Huang, Hsien-Te Kao, Spencer Lynch, Svitlana Volkova, Tongshuang Sherry Wu, Anita Woolley, Hao Zhu, Maarten Sap

arXiv:2504.16122v1 交叉公告类型摘要：通过大规模语言模型（LLM）代理进行社会模拟是一种探索和验证与社会科学问题和LLM代理行为相关假设的有前景的方法。我们提出了SOTOPIA-S4，这是一个快速、灵活且可扩展的社会模拟系统，它解决了当前框架的技术障碍，同时使实践者能够生成多轮和多方的LLM基于的交互，并具有自定义的评价指标以进行假设检验。SOTOPIA-S4作为一个pip包提供，包含模拟引擎、具有灵活RESTful API的API服务器以及一个网页界面，该界面使技术用户和非技术用户能够在无需编程的情况下设计、运行和分析模拟。我们通过两个用例展示了SOTOPIA-S4的实用价值，这些用例涉及二元招聘谈判和多方规划场景。

发布时间: 4/24/2025

查看原文

以数据为中心的方法，用于防止大型语言模型生成威胁性和有毒内容的安全与安全措施

作者: Chaima Njeh, Ha\"ifa Nakouri, Fehmi Jaafar

arXiv:2504.16120v1 声称类型: cross 摘要：大语言模型（LLM）取得了显著进步，但关于潜在偏见和有害内容的担忧仍然存在。为应对这些担忧，我们提出了一种切实可行的解决方案，以确保LLM的安全和伦理使用。我们的创新方法集中在后生成校正机制——BART-Corrective Model上，该机制调整生成内容以确保安全和安全性。与仅依赖模型微调或提示工程不同，我们的方法提供了一种稳健的数据为中心的替代方案，以减轻有害内容。我们通过在多个有毒数据集上进行实验，展示了我们方法的有效性，结果显示，集成后平均有害性和逃狱分数显著减少。具体来说，我们的结果显示，与GPT-4相比，平均有害性和逃狱分数减少了15%和21%；与PaLM2相比，这两项指标分别减少了28%和5%；与Mistral-7B相比，分别减少了约26%和23%；与Gemma-2b-it相比，分别减少了11.1%和19%。这些结果表明，我们方法的潜力在于提高LLM的安全性和安全性，使它们更适合实际应用。

发布时间: 4/24/2025

查看原文

面向解释性和轻量级实时网络边缘环境中网络威胁搜索的AI技术

作者: Milad Rahmati

arXiv:2504.16118v1 类型: cross 摘要：随着网络威胁的不断演变，由于边缘网络的分布式特性和资源限制，确保其安全变得越来越具有挑战性。许多基于人工智能的威胁检测系统依赖于复杂的深度学习模型，尽管这些模型的精度很高，但它们也存在两个主要缺点：缺乏可解释性以及高昂的计算成本。黑盒AI模型使得安全分析师难以理解其预测的理由，限制了其实际部署。此外，传统的深度学习技术需要大量计算资源，使得它们不适合具有有限处理能力的边缘设备。为了解决这些问题，本研究提出了一种解释性和轻量级AI (ELAI) 框架，用于边缘网络中的实时网络威胁检测。我们的方法将可解释的机器学习算法与优化的轻量级深度学习技术相结合，确保透明性和计算效率。所提出的系统利用决策树、基于注意力的深度学习和联邦学习来提高检测准确性，同时保持可解释性。我们使用CICIDS和UNSW-NB15等基准网络安全数据集对ELAI进行了评估，评估了其在不同网络攻击场景下的性能。实验结果表明，在降低计算需求的同时，所提出框架能够实现高检测率，且误报率极低。本工作的关键贡献包括：（1）一种专为边缘计算环境设计的新型可解释AI网络安全模型，（2）一种优化的轻量级深度学习方法，用于实时网络威胁检测，以及（3）对AI驱动的网络安全应用中的解释性技术进行全面分析。

发布时间: 4/24/2025

查看原文

基于上下文的稀有事件意识及其可解释性：发现和形式化关键故障模式

作者: Sridevi Polavaram, Xin Zhou, Meenu Ravi, Mohammad Zarei, Anmol Srivastava

arXiv:2504.16117v1 类型: cross 摘要：视觉系统在监控、执法、交通等关键领域中的应用日益普及。然而，它们在罕见或不可预见的场景中的脆弱性带来了重大的安全风险。为了解决这些挑战，我们引入了基于本体的认知稀有事件和解释性框架（CAIRO），该框架用于故障案例（或CP-关键现象）的检测和形式化。CAIRO的设计旨在通过人工介入测试和评估AI黑盒模型中误检、对抗性攻击和幻觉引起的严重性。我们对自动驾驶系统（ADS）中对象检测模型故障的稳健分析展示了可扩展且具有解释性的方法，以形式化摄像机感知与现实世界背景之间的观察到的差距，生成的测试案例以显式的OWL/XML知识图谱格式存储，方便分享、下游分析、逻辑推理和问责。

发布时间: 4/24/2025

查看原文

DMind基准测试：首个用于Web3领域大语言模型评估的综合基准

作者: Miracle Master, Rainy Sun, Anya Reese, Joey Ouyang, Alex Chen, Winter Dong, Frank Li, James Yi, Garry Zhao, Tony Ling, Hobert Wong, Lowes Yang

arXiv:2504.16116v1 Announce Type: cross 摘要：近年来，大型语言模型（LLMs）在广泛的语言处理任务上取得了显著进展。然而，它们在Web3这样专门且快速发展的领域中的有效性仍未得到充分探索。本文介绍了DMind基准，这是一个全新的框架，系统地测试了LLMs在九个关键类别中的表现，涵盖了区块链基础、基础设施、智能合约分析、去中心化金融（DeFi）、去中心化自治组织（DAOs）、不可替代代币（NFTs）、代币经济学、梗概念和安全漏洞。 DMind基准超越了传统的多项选择题形式，通过引入特定领域的主观任务（如智能合约代码审计与修复、链上数据的数值推理以及填空测试），从而捕获现实世界的复杂性并测试模型的适应性。我们在DMind基准上评估了包括ChatGPT、DeepSeek、Claude和Gemini系列在内的十五个流行模型，发现它们在Web3特定推理和应用方面存在性能差距，特别是在新兴领域如代币经济学和梗概念方面尤为明显。即使是最强的模型，在识别细微的安全漏洞和分析复杂的DeFi机制方面也面临重大挑战。为了促进该领域的发展，我们公开发布了我们的基准数据集、评估管道和标注结果，网址为http://www.dmind.ai，为特定领域适应的进展和开发更稳健的Web3增强LLMs提供了宝贵资源。

发布时间: 4/24/2025

查看原文

基于AI的NFT智能合约漏洞分析

作者: Xin Wang, Xiaoqi Li

arXiv:2504.16113v1 交叉类型公告摘要：在本文的研究实验中，我们的研究工作分为几个阶段。首先，我们收集了大量的智能合约代码并进行了分类，识别出几种常见的缺陷，包括Risky Mutably Proxy、ERC-721 Reentrancy、 Unlimited Mining、Missing Requirements 和 Public Burns。其次，我们使用Python处理了这些智能合约。一方面，我们修改了文件名；另一方面，我们批量处理内容进行分析和应用。接下来，我们构建了一个决策树模型。首先，我们进行了特征提取。我们选择了算法并划分了数据。在比较和处理后，我们选择了CART分类树进行处理。通过基因系数分析和整理数据，我们得到了决策树的初始模型。然后，在决策树的基础上，我们引入了随机森林模型。从抽样相同数量的数据到随机选择特征，从调整和优化参数到完成森林模型的构建。最后，我们在论文中比较和分析了决策树、随机森林和自建模型，并得出了总体结论。

发布时间: 4/24/2025

查看原文

HPU：高带宽处理单元，用于通过GPU协处理实现可扩展且成本有效的LLM推理

作者: Myunghyun Rhee, Joonseop Sim, Taeyoung Ahn, Seungyong Lee, Daegun Yoon, Euiseok Kim, Kyoung Park, Youngpyo Joo, Hosik Kim

arXiv:2504.16112v1 宣告类型: cross 摘要: Transformer基大型语言模型中的注意力层由于其低运算强度和大量的KV缓存内存需求，在当前GPU系统中带来了效率低下。我们提出了一种高带宽处理单元（HPU），这是一种内存密集型协处理器，在大规模批处理的LLM推理过程中增强GPU资源利用。通过卸载内存限制的操作，HPU使GPU能够专注于密集计算任务，从而提高整体效率。此外，作为附加卡，HPU可以扩展以应对由大规模批处理和长序列长度驱动的不断增长的内存需求。在本文中，我们展示了使用基于PCIe的FPGA卡安装在GPU系统上的HPU原型。我们新颖的GPU-HPU异构系统在与仅GPU系统相比时，性能提升高达4.1倍，能效提升高达4.6倍，无需增加GPU数量即可实现扩展能力。

发布时间: 4/24/2025

查看原文

安全优先AI：稳健且可信赖系统的基石

作者: Krti Tallam

arXiv:2504.16110v1 安全类型：跨域摘要：关于人工智能（AI）的讨论通常集中在安全、透明度、问责制、对齐和责任等方面。然而，人工智能安全（即保护数据、模型和管道免受恶意操纵）是所有这些努力的基础。本文建议必须将人工智能安全作为基础层面予以优先考虑。我们提出了一个分层的人工智能挑战视角，区分安全与安全，主张采取以安全优先的方法，以促进可信赖和韧性的人工智能系统。我们讨论了核心威胁模型、关键攻击向量以及新兴的防御机制，结论认为，以度量驱动的方法对于实现稳健的人工智能安全、透明度和问责制是必不可少的。

发布时间: 4/24/2025

查看原文

xLSTM-ECG：基于特征融合的多标签心电图分类

作者: Lei Kang, Xuanshuo Fu, Javier Vazquez-Corral, Ernest Valveny, Dimosthenis Karatzas

arXiv:2504.16101v1 Announce Type: cross 摘要：心血管疾病（CVDs）仍然是全球死亡的主要原因，突出强调了对高效和准确的诊断工具的迫切需求。心电图（ECGs）在诊断各种心脏状况中不可或缺；然而，其手动解读耗时且容易出错。在本文中，我们提出了一种名为xLSTM-ECG的新方法，该方法利用扩展的长短期记忆（xLSTM）网络进行心电图信号的多标签分类，并使用了PTB-XL数据集。据我们所知，这项工作代表了第一个用于多标签心电图分类的xLSTM模块的设计和应用。我们的方法使用短期傅里叶变换（STFT）将时间序列的心电图波形转换到频域，从而增强特征提取。xLSTM架构特别针对12导联心电图记录的复杂性进行了调整，以捕捉局部和全局信号特征。在PTB-XL数据集上的全面实验表明，我们的模型在多标签分类性能上表现出色，而对Georgia 12-Lead数据集的额外测试进一步证明了其鲁棒性和效率。此方法显著提高了心电图分类准确性，从而推动了临床诊断和患者护理的发展。在接受后，代码将公开提供。

发布时间: 4/24/2025

查看原文

面向可再生能源准确预测的研究：构建数据集并评估机器学习模型在法国太阳能和风能功率上的表现

作者: Eloi Lindas, Yannig Goude, Philippe Ciais

arXiv:2504.16100v1 宣告类型：交叉摘要：准确预测不可调度的可再生能源对于电网稳定性和价格预测至关重要。区域电力供应预测通常通过工厂级预测的自下而上的方法间接实现，包含滞后电力值，并不充分利用空间解析数据的潜力。本研究提出了一种全面的方法，使用空间显式天气数据和生产站点的空间信息，通过机器学习模型预测法国国家规模的太阳能和风能生产。数据集涵盖从2012年到2023年，以RTE（国家电网运营商）的日电力生产数据作为目标变量，包含ERA5的日气象数据、生产站点的容量和位置以及电力价格作为输入特征。探索了三种方法来处理空间解析天气数据：国家尺度的空间平均化、主成分分析的空间维度降低，以及计算机视觉体系结构以利用复杂的空间关系。研究在日电力生产数据上基准测试了最先进的机器学习模型以及基于交叉验证方法的超参数调优方法。结果表明，针对时间序列的交叉验证最适合达到低误差。我们发现，神经网络倾向于优于传统的树基模型，由于随着时间可再生能源容量的增加，传统树基模型在外推方面面临挑战。模型在中期展望上的nRMSE从4%到10%不等，实现了与单一工厂级别建立的局部模型相似的误差指标，突显了这些方法在区域电力供应预测中的潜力。

发布时间: 4/24/2025

查看原文