arXiv 论文列表

数字化支持的自发 speech 分析（DigiSpon）：瑞士儿童 speech 语言样本分析的自然语言处理基准测试

作者: Anja Ryser, Yingqiang Gao, Sarah Ebling

arXiv:2504.00780v1 交叉类型公告摘要：语言样本分析（LSA）是一种补充标准化心理测量测试的方法，用于诊断儿童发展性语言障碍（DLD）等问题。然而，其劳动密集型的性质限制了其在言语病理实践中的应用。我们介绍了利用基于商业大规模语言模型（LLMs）之外的自然语言处理（NLP）方法，应用于瑞士德语地区119名儿童的转录言语数据，这些儿童的语言发展情况通常和异常。该研究旨在在有人参与的框架内识别出支持言语病理学家更高效地诊断DLD的最佳实践，而不依赖于可能违反伦理的商业LLM实施方式。初步发现强调了将本地部署的NLP方法整合到半自动LSA过程中的潜在可能性。

发布时间: 4/2/2025

查看原文

LLMs4SchemaDiscovery：一种结合大型语言模型的科学模式挖掘人体在环工作流

作者: Sameer Sadruddin, Jennifer D'Souza, Eleni Poupaki, Alex Watkins, Hamed Babaei Giglou, Anisa Rula, Bora Karasulu, S\"oren Auer, Adrie Mackus, Erwin Kessels

arXiv:2504.00752v1 声明类型: cross 摘要：从非结构化文本中提取结构化信息对于建模现实世界过程至关重要，但传统的模式挖掘依赖于半结构化数据，限制了其可扩展性。本文介绍了一种名为 schema-miner 的新型工具，该工具结合了大语言模型和人类反馈，以自动化和细化模式提取。通过迭代的工作流程，它组织文本中的属性，整合专家输入，并结合领域特定的本体论以增加语义深度。在材料科学（具体而言是原子层沉积）中应用 schema-miner 表明，专家指导的大语言模型能够生成语义丰富的模式，适用于多种现实世界的应用。

发布时间: 4/2/2025

查看原文

多模态差分演化的发展：综合回顾与未来展望

作者: Dikshit Chauhan, Shivani, Donghwi Jung, Anupam Yadav

arXiv:2504.00717v1 关注类型: 交叉摘要：多模态优化涉及识别函数的多个全局和局部最优解，提供了解决空间内多种最优点的宝贵见解。进化算法（EAs）在单次运行中找到多个解方面表现出色，这为与经常需要多次重启且难以保证获得多样化解的传统优化技术相比提供了独特的优势。在这类EAs中，差分进化（DE）因其在连续参数空间中的强大且多功能优化器地位而突出。DE已经通过利用基于种群的搜索促进了多个稳定子种群的形成，每个子种群针对不同的最优解。近年来，DE在多模态优化方面的进展集中在分群方法、参数适应、与其他算法（包括机器学习）的混合以及在各种领域中的应用。鉴于这些发展，现在是进行最新文献综述并确定关键未来研究方向的良好时机。本文提供了近期DE在多模态优化方面的全面概述，包括处理多个最优解的方法、与EAs的混合以及与机器学习的混合应用，并强调了一系列实际应用。此外，本文从多个角度列出了具有挑战性的开放问题和未来研究议题。

发布时间: 4/2/2025

查看原文

使用机器学习实现的科学自主性： astrobiology 应用

作者: Victoria Da Poian, Bethany Theiling, Eric Lyness, David Burtt, Abigail R. Azari, Joey Pasterski, Luoth Chou, Melissa Trainer, Ryan Danell, Desmond Kaplan, Xiang Li, Lily Clough, Brett McKinney, Lukas Mandrake, Bill Diamond, Caroline Freissinet

arXiv:2504.00709v1 交叉类型: 跨学科摘要：近年来，人工智能（AI）包括机器学习（ML）已经成为空间任务的关键组成部分，使其能够实现快速数据处理、高级模式识别和增强的信息提取。这些工具在天体生物学应用中尤其有价值，在天体生物学应用中，模型必须从复杂的无生物背景中区分出生物模式。将人工智能和机器学习的自主性整合到空间任务中是一项复杂的挑战，我们相信通过专注于关键领域，我们可以取得显著进展，并提供实用的建议以应对这些障碍。

发布时间: 4/2/2025

查看原文

能量加权学习进展引导交错多任务学习

arXiv:2504.00707v1 Announce Type: cross 摘要：人类可以通过利用现有技能和知识来不断获得新的技能和知识，从而改进学习，同时又不会忘记这些知识。类似地，在机器学习中，“持续学习”旨在在保留先前获得的知识的同时学习新信息。现有研究往往忽略了人类学习的本质，由于人类选择或环境约束，任务通常是交错进行的。因此，人类很少在一个任务完全掌握后才切换到下一个任务。为了探讨人类似的学习能为学习者带来多大程度上的益处，我们提出了一种根据“学习进度”和能量消耗交错任务的方法。从机器学习角度来看，我们的方法可以被视为一种在平衡学习性能和能量约束的同时模仿生态上现实的人类任务学习的多任务学习系统。为了评估我们方法的有效性，我们在仿真环境中考虑了一个机器人学习的设置，其中机器人在不同的环境中学习其行为的效果。进行的实验表明，我们提出的方法在任务学习性能上优于顺序任务学习，并且降低了学习任务时的能量消耗。

发布时间: 4/2/2025

查看原文

The HCI 生成人工智能 CO2ST 计算器：一种计算人类计算机交互研究中生成人工智能使用碳足迹的工具

作者: Nanna Inie, Jeanette Falk, Raghavendra Selvan

arXiv:2504.00692v1 类别:交叉学科摘要：生成型人工智能（GenAI）在人机交互（HCI）研究中的使用增加了硬件因开发和运行GenAI模型及系统而产生的能源消耗，进而导致了碳排放。由于HCI研究者通常使用云服务，而云服务中的硬件及其能源消耗隐藏在幕后，因此在HCI研究中准确估算能源消耗和随后的碳排放颇为困难。为了帮助HCI研究者估算在其研究中使用生成型人工智能的能源消耗和碳足迹，《HCI GenAI CO2ST 计算器》是一个专门为此研究流程设计的工具，它可以让研究者在事前（允许采取缓解策略或实验重设计）或事后（允许在研究报告中透明地记录碳足迹）估算使用生成型人工智能的能源消耗和碳足迹。

发布时间: 4/2/2025

查看原文

DynMoLE: 结合混合路由机制提升LoRA专家混合模型微调效率

作者: Dengchun Li, Naizheng Wang, Zihao Zhang, Haoyang Yin, Lei Duan, Meng Xiao, Mingjie Tang

arXiv:2504.00661v1 交叉类型: cross 摘要: 基于指令的大型语言模型（LLMs）细调已在各种自然语言处理（NLP）任务中取得了卓越的成功。参数效率细调（PEFT）方法，例如混合LoRA专家模型（MoLE），结合了低秩适应（LoRA）的高效性和专家模型混合（MoE）的灵活性，展示了处理多个下游任务的巨大潜力。然而，现有的MoLE路由机制通常在计算效率和预测准确性之间存在权衡，并且无法充分解决不同Transformer层中的专家选择需求。在本文中，我们提出了一种名为DynMoLE的混合路由策略，该策略根据路由器概率分布的Tsallis熵动态调整专家选择。这种做法减轻了路由器的不确定性，增强了稳定性，并促进了更公平的专家参与，从而加快了收敛速度并提高了模型性能。此外，我们引入了一个基于Tsallis熵的辅助损失，以进一步引导模型减少不确定性并更好地收敛，从而提高训练稳定性和性能。我们在常识推理基准上的广泛实验表明，DynMoLE实现了显著的性能提升，比LoRA提高了9.6%，并超越了最先进的MoLE方法MoLA 2.3%。我们还进行了全面的消融研究，以评估DynMoLE的关键组件的贡献。

发布时间: 4/2/2025

查看原文

向适应性AI治理迈进：来自美国、欧盟和亚洲的比较洞察

作者: Vikram Kulothungan, Deepti Gupta

arXiv:2504.00652v1 公告类型: cross 摘要：人工智能(AI)的趋势在全球不同地区差异显著，塑造了创新、监管和社会影响的轨迹。这种差异影响了不同地区在AI开发中的做法，平衡了技术进步与伦理和监管考虑。这项研究对美国(US)、欧盟(EU)和亚洲的AI趋势进行了比较分析，重点关注三个关键维度：生成型AI、伦理监督和工业应用。美国优先考虑市场驱动的创新，最小化监管限制，欧盟实施预防性风险框架，强调伦理保障，亚洲采用国家指导的AI策略，平衡快速部署与监管审查。尽管这些方法反映了不同的经济模式和政策优先事项，但它们的差异给国际合作、监管协调和全球AI标准的制定带来了挑战。为了应对这些挑战，本文综合了区域优势，提出了一个适应性AI治理体系，该体系结合了风险梯级监督、创新加速器和战略对齐机制。通过弥合治理缺口，本研究提供了有关促进负责任AI开发并确保技术进步、伦理约束和监管一致性平衡的可操作性见解。

发布时间: 4/2/2025

查看原文

基于深度神经网络的图像分类器中数据重复的影响：稳健模型与标准模型

作者: Alireza Aghabagherloo, Aydin Abadi, Sumanta Sarkar, Vishnu Asutosh Dasu, Bart Preneel

arXiv:2504.00638v1 类型: cross 摘要：机器学习模型对抗恶意攻击的准确性和稳健性受到了训练数据质量、模型架构、训练过程和部署环境等多种因素的影响。近年来，训练集中重复数据，尤其是在语言模型中，引起了广泛关注。已有研究表明，去重可以提高语言模型的训练性能和模型准确性。尽管人们普遍认识到训练图像分类器深度神经网络(DNN)时数据质量的重要性，但训练集中重复图像对模型泛化能力和性能的影响却受到了较少的关注。在本文中，我们填补了这一空白，并对图像分类中的重复项影响进行了全面的研究。我们的分析表明，训练集中存在重复图像不仅会负面影响模型的训练效率，还可能导致图像分类器的准确性降低。重复数据对准确性的影响特别明显，尤其是在类间重复数据不均匀分布时，或在对抗训练模型的训练集中出现重复数据时，无论是均匀还是非均匀。即使重复样本按照均匀方式选择，增加重复量也不会显著提高准确性。

发布时间: 4/2/2025

查看原文

CNOT-最优克利福德综合作为SAT

作者: Irfansha Shaik, Jaco van de Pol

arXiv:2504.00634v1 交叉公告类型摘要：克利福德电路优化是量子编译管道中的一个关键步骤。主要的编译器采用了启发式方法。虽然这些方法速度快，但结果往往不理想。减少嘈杂门，如2-qubit CNOT门，对于实用计算至关重要。已经提出了精确方法来弥补启发式方法的不足。其中，基于SAT的方法可以通过优化门的数量或深度来优化电路，但它们面临扩展性问题。此外，它们不能在更关键的度量标准，如CNOT数量或CNOT深度，上保证最优性。最近的一项工作提出仅在特定范式下的克利福德电路中进行全面搜索以保证CNOT数量的最优性。但全面的方法无法扩展到超过6个量子比特。在本文中，我们结合限制在克利福德范式下的搜索来优化CNOT数量的SAT编码。通过允许并行计划，我们提出了一种新的SAT编码来优化CNOT深度。借助基于SAT的方法的灵活性，我们还处理了硬件平台的连接性限制，并允许量子比特重新标记。我们在开源工具Q-Synth中实现了上述编码和变体。在实验中，我们的编码在随机克利福德电路方面显著优于现有的SAT方法。我们采用实际的VQE和费曼基准与TKET和Qiskit编译器进行比较。在全连接情况下，我们观察到CNOT数量最多减少32.1%，CNOT深度最多减少48.1%。总体而言，我们观察到在CNOT数量和深度上比TKET有更好的结果。我们还尝试了主要量子平台的连接性限制。与Qiskit相比，我们观察到CNOT数量最多减少30.3%，CNOT深度最多减少35.9%。

发布时间: 4/2/2025

查看原文