arXiv 论文列表

作者: Sushant Singh, Ausif Mahmood

arXiv:2504.13981v1 交叉公告类型摘要：在基于变压器的语言模型中高效处理长上下文并在低困惑度下是一个活跃的研究领域。诸如Linformer、Longformer、Performer和结构化状态空间模型（SSMs）等许多最近的方法尚未完全解决这个问题。所有这些模型都在努力降低注意力机制的二次时间复杂度，同时尽量减少因有效压缩长上下文而导致的质量损失。受计算机中的缓存和虚拟内存原理的启发，在缓存缺失的情况下，不仅会从内存中检索出所需的缓存，还会获得相邻的数据，我们在此概念下通过将长上下文分割成小片段来处理长上下文。在我们的设计中，当在压缩级别上发生高片段级注意力时，我们可以以未压缩的形式检索邻近的片段。我们处理长上下文的增强功能包括聚合四种注意力机制，即短滑动窗口注意力、长压缩分割注意力、动态检索高注意力未压缩的前k个片段，以及在长片段注意力中重叠片段，以避免片段碎片化。这些增强功能产生了一种架构，其在同等模型大小下，平均困惑度改进了8.5%，超越了现有最先进的架构。

发布时间: 4/22/2025

查看原文

负责任人工智能的框架、标准、应用和最佳实践综述

作者: Thippa Reddy Gadekallu, Kapal Dev, Sunder Ali Khowaja, Weizheng Wang, Hailin Feng, Kai Fang, Sharnil Pandya, Wei Wang

arXiv:2504.13979v1 跨领域公告类型：交叉学科摘要：负责任的人工智能（RAI）是一种与人工智能的使用伦理相结合的概念，与普遍和标准的框架相一致。这篇综述文章全面讨论了全球和国家标准、RAI的应用、当前使用RAI的技术以及正在进行的RAI项目，并分析了在基于人工智能的行业和项目中实施和设计RAI所面临的可能挑战。目前，伦理标准和RAI的实施是脱钩的，这让每个行业可以根据自己的标准使用AI来实现伦理化。许多全球企业和政府机构正在采取必要的举措来设计一个共同和标准的框架。社会压力和不道德使用AI的方式促使人们更加注重RAI的设计而不是实施。

发布时间: 4/22/2025

查看原文

未来加油站：零售下游领域AI/ML和IoT的视角

作者: Wrick Talukdar

arXiv:2504.13976v1 类型: cross 摘要：未来的加油站正准备从一个简单的加油中心转变为由人工智能（AI）、机器学习（ML）和物联网（IoT）的发展所驱动的智能零售枢纽。本文探讨了技术如何重塑下游零售市场，同时简要介绍了上游和中游市场。通过利用AI/ML进行预测分析、动态定价、个性化客户互动以及物联网进行实时监控和自动化，未来的加油站将重新定义燃油零售体验。此外，本文还涵盖了统计数据、AI/ML的核心技术概念、数学公式、案例研究以及一个完全自主加油站的拟议框架。

发布时间: 4/22/2025

查看原文

多尺度张量求和分解作为新型多维数据处理神经网络层（MTS 层）

作者: Mehmet Yama\c{c}, Muhammad Numan Yousaf, Serkan Kiranyaz, Moncef Gabbouj

arXiv:2504.13975v1 Announce Type: 交叉摘要：多层感知器（MLP），或完全连接的人工神经网络，以可学习的权重矩阵执行向量-矩阵乘法；然而，由于每一层输入-输出对的高维度性，它们在许多机器学习任务中的实际应用，特别是在计算机视觉领域，可能会受到限制。为了提高效率，已经利用卷积操作来促进权重共享和局部连接，但它们受制于有限的感受野。在本文中，我们引入了多尺度张量求和（MTS）因子化，这是一种新颖的神经网络算子，实现了多尺度的张量求和，其中每个要求和的张量通过类似于Tucker分解的方式获得。与文献中其他张量分解方法不同，MTS并不是作为一种网络压缩工具引入的，而是作为一种新的骨干神经层。MTS不仅减少了所需参数的数量，而且与传统的密集层（即MLP层中的未分解权重矩阵）相比，在权重优化的效率方面也有所提高，而且还优于卷积层。提出的MTS网络与MLP和卷积神经网络（CNN）的概念验证实验比较表明，它们在各种任务（如分类、压缩和信号恢复）中展现了有效性。此外，当与本研究中引入的多头门（MHG）等现代非线性单元集成时，相应的神经网络MTSNet在各种计算机视觉应用中的复杂性-性能折中比最先进的变压器更为有利。MTS层及其相应的MTS基网络MTSNets的软件实现可在https://github.com/mehmetyamac/MTSNet上获取。

发布时间: 4/22/2025

查看原文

使用加权深度学习方法增强脑中Stroke诊断

作者: Yao Zhiwan, Reza Zarrab, Jean Dubois

arXiv:2504.13974v1 类型: 交叉摘要：脑中风是由于大脑某部分的血液供应中断，导致细胞死亡。传统的大脑中风诊断方法，如CT扫描和MRI，既昂贵又耗时。本研究提出了一种加权投票集成(WVE)机器学习模型，该模型结合了随机森林、深度学习和直方图梯度提升等分类器的预测，以更有效地预测中风。该模型在私有数据集上实现了94.91%的准确率，使得早期风险评估和预防成为可能。未来的研究可以探索优化技术以进一步提高准确性。

发布时间: 4/22/2025

查看原文

从人类反馈强化学习中的治理挑战：评估者理性与强化稳定性

作者: Dana Alsagheer, Abdulrahman Kamal, Mohammad Kamal, Weidong Shi

arXiv:2504.13972v1 宣告类型: cross 摘要: 人类反馈强化学习（RLHF）在使大型语言模型（LLMs）与人类价值观和期望相一致方面起着核心作用。然而，这一过程仍然面临着治理挑战，包括评估者的偏见、不一致性和反馈的不可靠性。本研究探讨了评估者的认知能力，即他们的理性水平，对强化信号稳定性的影响。一项比较高理性水平和低理性水平参与者的受控实验表明，高理性水平的评估者产生的反馈更为一致且更符合专家标准。相反，低理性水平的参与者在强化决策上表现出显著的变异性（p < 0.01）。为了应对这些挑战并改善RLHF治理，我们建议实施评估者的预筛选、系统性的反馈一致性审核以及可靠性加权的强化聚合。这些措施增强了AI对齐管道的公平性、透明度和稳健性。

发布时间: 4/22/2025

查看原文

6G网络中物联网和多模态语言模型的未来：机遇与挑战

作者: Abdelrahman Soliman

arXiv:2504.13971v1 交叉公告类型摘要：基于人工智能和物联网研究的最新趋势，这篇综述论文探讨了将物联网（IoT）和多模态语言模型（MLLMs）结合的协同潜力，旨在为未来的6G系统提供参考。该论文集中探讨了这种结合在不同领域的应用，如医疗保健、农业和智能城市，并调查了物联网整合的四大支柱，如传感器、通信、处理和安全。论文提供了一个全面的物联网和MLLM技术及其应用的描述，并探讨了每项支柱中多模态的作用，最后总结了该领域最重要的挑战和未来研究的方向。总的综述为对MLLM和物联网应用领域感兴趣的科研人员提供了一条路线图，突显了这一迅速发展的领域中的潜力和挑战。综述认识到需要应对数据可用性、计算成本、隐私和实时处理等问题，以充分利用物联网、MLLM和6G技术的全部潜力。

发布时间: 4/22/2025

查看原文

玩转故事：面向幼儿叙事发展和AI literacy的交互式讲故事框架

作者: Nayoung Choi, Peace Cyebukayire, Jinho D. Choi

arXiv:2504.13969v1 Announce Type: 横向摘要：本文介绍了Tinker Tales，这是一种以桌面游戏形式的互动叙事框架，旨在支持幼儿期的叙事发展和人工智能素养教育。该框架通过附有NFC芯片的棋子和标记、以及扬声器和麦克风，结合了 tangible 和语音互动方式与人工智能。儿童使用棋子和标记来选择并定义关键故事情节元素，如角色、地点、物品和情绪，为人工智能提供进一步的细节，并获得适当的帮助，类似于成人如何为特定任务提示人工智能（例如，写作）。为了评估，模拟了几场游戏会话，使用了儿童AI代理，并从多个角度评估了生成故事的质量和安全性。本文强调了结合物理和数字元素的人工智能素养教育潜力，为儿童提供了一种安全且吸引人的学习方式，以便有效与人工智能合作。

发布时间: 4/22/2025

查看原文

CONTINA：具有覆盖保证的交通需求预测置信区间

作者: Chao Yang, Xiannan Huang, Shuhan Qiu, Yan Cheng

arXiv:2504.13961v1 类型: cross 摘要：准确的短期交通需求预测对于交通系统的运营至关重要。除了点估计外，预测的置信区间也非常重要。许多用于交通运营的模型，如共享单车再平衡和出租车调度，会考虑到未来需求的不确定性，并需要置信区间作为输入。然而，现有的置信区间建模方法依赖于严格的假设，如交通模式不变和正确的模型设定，以确保足够的覆盖率。因此，提供的置信区间可能无效，特别是在不断变化的交通环境中。为了解决这一问题，我们提出了一种高效的方法CONTINA（Conformal Traffic Intervals with Adaptation），以提供能够适应外部变化的区间预测。通过收集部署期间区间的误差，该方法可以在下一次预测中根据误差大小适当调整区间的宽度或缩短。此外，我们从理论上证明，我们方法提供的置信区间覆盖率将收敛到目标覆盖率水平。在四个真实的现实数据集和预测模型的实验中表明，所提出的方法可以提供更短且有效的置信区间。我们的方法可以帮助交通管理人员在实践中制定更加合理和稳健的运营计划。我们已在\href{https://github.com/xiannanhuang/CONTINA/}{GitHub}上发布了代码、模型和数据集。

发布时间: 4/22/2025

查看原文

AI安全应优先考虑工作未来的发展

作者: Sanchaita Hazra, Bodhisattwa Prasad Majumder, Tuhin Chakrabarty

arXiv:2504.13959v1 Announce Type:交叉摘要：当前在人工智能安全领域的努力侧重于过滤有害内容、防止操纵人类行为以及消除网络安全或生物安全中的生存风险。虽然十分重要，但这种狭窄的重点忽视了塑造社会长期轨迹的关键人类中心因素。在这篇立场文件中，我们指出了忽视人工智能对未来工作的影响所带来的风险，并建议提供全面的转型支持，以促进有意义的人类劳动发展。通过经济理论的视角，我们强调了人工智能对人类生计的跨时期影响及其加剧收入不平等的结构性变化。此外，主要的AI开发利益相关者采取的闭源方法类似于通过利用资源、削弱创意劳动，并垄断创新来寻求租金收入的行为。为解决这一问题，我们主张建立一个坚实的国际版权结构，通过实施集体许可来确保公平的补偿机制，以利用数据训练AI模型。我们强烈建议建立一个支持共同繁荣和经济正义、同时减少技术债务的全球AI治理框架。

发布时间: 4/22/2025

查看原文