arXiv:2502.04658v1 交叉公告类型
摘要:人类和人工智能的结合代表了一种科学上前进我们对信息处理理解的机会,因为每个系统都提供了独特的计算洞察,可以增强和启发对方。将人类认知原则与人工智能相结合有可能产生更可解释和功能对齐的计算模型,同时提供一种正式框架,通过系统模型比较和表示分析来研究感知、学习和决策背后的神经机制。在本研究中,我们介绍了一种个性化的脑启发建模方法,该方法结合了人类行为嵌入和神经数据,以与认知过程对齐。我们采用了一步步的方法,对大规模行为决策、群体水平的神经数据以及最终的参与者水平的神经数据进行了CLIP模型的微调,最后我们在一个名为CLIP-Human-Based Analysis(CLIP-HBA)的更广泛的框架下完成了这一过程。我们发现,通过对行为数据的微调可以增强其预测人类相似性判断的能力,同时间接地将其与MEG捕捉到的动力学表示对齐。为了进一步深入研究认知过程的时间演变机制,我们引入了一种特别针对毫秒级MEG神经动力学进行微调的模型(CLIP-HBA-MEG)。该模型在增强了与人类神经处理的时间对齐性的同时,仍然在行为对齐方面有所提升。最后,我们对参与者特定的神经数据进行了个性化模型的训练,有效地捕捉了个体神经动力学,突显了个性化人工智能系统的潜力。这些个性化系统在医学、认知研究、人机界面和AI开发等领域具有深远的含义。
arXiv:2502.04646v1 类型: cross
摘要: 重要性采样是一种涉及从与重要性权重函数和基础概率密度函数(PDF)的乘积成比例的概率密度函数中采样的技术,它是一种强大的方法,应用于减少方差、有偏或定制化采样、数据增强等。受评分生成模型(SGMs)日益可用的启发,我们提出了一种完全无需训练的重要性采样框架,仅依赖于一种SGM作为基础PDF。我们的一项关键技术创新是将重要性采样过程视为一个反向扩散过程,该过程以基础PDF的评分函数和指定的重要性权重函数的形式表示——两者都可以轻松获取,从而完全不需要额外的训练。我们进行了全面的分析,证明了该方法在多种数据集和任务上的可扩展性和有效性,包括使用神经重要性权重函数进行工业和自然图像的重要性采样。我们的方法的无需训练特性在实际应用场景中特别具有吸引力,因为在这些场景中,单个基础分布涵盖了多个有偏采样任务,每个任务需要不同的重要性权重函数。据我们所知,这是我们第一次提出能够实现这一点的重要性采样框架。
arXiv:2502.04645v1 声明类型: cross
摘要:神经排序模型(NRMs)在信息检索任务中迅速提升了最新的性能。在本项工作中,我们调查了一种MiniLM的Cross-Encoder变体,以确定它计算哪些相关性特征以及这些特征存储在哪里。我们发现,它以一种可解释的方式使用了传统的BM25的语义变体,其中包括局部组件:(1)通过控制词汇项饱和度和文档长度效应来计算软词频的Transformer注意力头,(2)其嵌入矩阵的低秩组件,编码词汇表中的逆文档频率信息。这表明Cross-Encoder使用与BM25相同的基本机制,但进一步利用它们的能力来捕捉语义以提高检索性能。这种精细的理解为模型编辑提供了基础,以增强模型透明度、解决安全问题,并提高训练和实际应用中的扩展性。
arXiv:2502.04638v1 宣告类型: cross
摘要:街景图像在城市视觉环境的表示学习中被广泛使用,支持各种可持续发展目标,如环境感知和经济社会发展评估。然而,现有的图像表示方法难以具体编码街景图像中动态城市环境(如行人、车辆和植被)、建成环境(包括建筑物、道路和城市基础设施)以及环境氛围(如文化和经济氛围)的特征,以解决与城市相关的下游任务。在这项工作中,我们提出了一种创新的自监督学习框架,利用街景图像的时间和空间属性,学习动态城市环境的图像表示,以支持多种下游任务。通过在同一地点不同时段采集的街景图像以及同时采集的地理位置邻近的视角图像,我们构建了对比学习任务,旨在学习建成环境的时间不变特征和空间不变的邻域氛围特征。我们的方法在视觉场所识别、经济社会发展评估和人类环境感知等任务中显著优于传统的有监督和无监督方法。此外,我们展示了通过不同对比学习目标学习的图像表示在各种下游任务中的不同行为。本研究系统地讨论了基于街景图像的城市研究中的表示学习策略,提供了一个提升城市科学研究中视觉数据应用性的基准。代码可在 https://github.com/yonglleee/UrbanSTCL 获取。
arXiv:2502.04636v1 Announce Type: 横向
摘要:Android生态系统易遭受应用程序重新打包、伪造和盗版等问题的威胁,这对开发者和用户构成了风险。为了缓解这些风险,开发者通常会采用代码混淆技术。虽然代码混淆在保护合法应用程序方面非常有效,但它也会阻碍安全调查,因为它常常被恶意使用。因此,了解Android应用程序中的代码混淆实践非常重要。在本文中,我们分析了从2016年到2023年长达八年的超过500,000个Google Play的APK文件,以研究代码混淆技术的发展和流行程度。首先,我们提出了一组分类器来检测混淆代码、工具和方法,然后进行纵向分析以确定趋势。结果显示,从2016年到2023年,代码混淆增加了13%,ProGuard和Allatori是最常用的工具。我们还表明,在排名靠前的应用程序和游戏类别(如 казино应用)中,代码混淆更为普遍。据我们所知,这是对Google Play Store中代码混淆采用的首次大规模研究,为开发者和安全分析师提供了宝贵的见解。
arXiv:2502.04602v1 交叉类型: cross
摘要:将大型语言模型(LLMs)与人类价值观和偏好对齐,通常通过基于人类反馈的微调来实现,这对于确保安全和负责任的AI行为至关重要。然而,这个过程通常需要大量的数据和计算资源。最近的研究揭示,通过更简单的方法,如上下文学习,可能以较低的成本实现对齐。这引发了问题:对齐是否主要是表面性的?在这篇文章中,我们探讨了这个问题,并进行了定量分析。我们将表面知识的概念形式化,定义为可以通过简单的标记重新排列获得的知识,而不影响模型捕捉标记之间潜在因果关系的能力。我们提出了一种方法,从对齐模型中提取和隔离表面知识,重点是浅层修改最终标记选择过程。通过将仅增加载体表面知识的模型与完全对齐的模型进行比较,我们量化了对齐中的表面部分。我们的研究发现,虽然表面知识在对齐中占据显著部分,尤其是在安全性和去毒任务中,但这并不全是故事。需要推理和上下文理解的任务仍然依赖于更深层次的知识。此外,我们展示了孤立的表面知识的两个实际优势:(1)它可以被模型之间转移,使较大的模型能够通过从小模型中提取的表面知识实现高效的离线对齐;(2)它是可恢复的,允许在不影响性能的情况下恢复受损模型的对齐。
arXiv:2502.04593v1 类型: cross
摘要:当前最先进的动力模型,如Mamba,假设给定序列中的所有元素具有相同的噪声水平,这限制了其在嘈杂的时间数据上的性能。在本文中,我们介绍了$\alpha$-Alternator,这是一种新型的时间依赖数据生成模型,可以根据序列中变化的噪声水平动态调整其复杂性。$\alpha$-Alternator利用Vendi评分(VS),这是一种灵活的基于相似性的多样性度量,每一步$t$,根据VS调整时间$t$处序列元素及其迄今为止的动力学的潜在表示对预测未来动力学的影响。这种影响由一个参数捕获,该参数在给定数据集中的所有序列中学习并共享。该参数的符号决定了影响的方向。当该参数为负值时,表示数据集嘈杂,序列元素中增加VS的部分被视为噪声,模型在处理该元素时更多地依赖潜在历史。相反,当参数为正值时,增加VS的序列元素被视为有用的信息,$\alpha$-Alternator在更新其预测潜在动力学时更多依赖这种新输入而非潜在历史。$\alpha$-Alternator通过观测蒙版和Alternator损失最小化相结合的方式进行训练。蒙版模拟了序列中的变化噪声水平,使得模型更能承受这些波动并提高了轨迹预测、插补和预测方面的性能。我们的实验结果表明,在神经解码和时间序列预测基准测试中,$\alpha$-Alternator在两者上都优于Alternator和最先进的状态空间模型。
arXiv:2502.04592v1 交叉公告类型:交叉
摘要:准确预测宏观经济事件的影响对于投资者和政策制定者来说至关重要。如货币政策决定和就业报告等显著事件通常会通过塑造经济增长和风险的预期来引发市场变动,从而在事件与市场行为之间建立因果关系。现有的预测方法通常侧重于文本分析或时间序列建模,但未能捕捉到金融市场多模态的性质以及事件与价格变动之间的因果关系。为了解决这些问题,我们提出了CAMEF(因果增强多模态事件驱动金融预测),这是一种有效的多模态框架,结合了文本和时间序列数据,并采用因果学习机制和基于LLM的反事实事件增强技术,以增强因果的金融预测。我们的贡献包括:(1)一个多模态框架,捕捉政策文本与历史价格数据之间的因果关系;(2)一个新的金融数据集,从2008年到2024年4月包含六种类型的宏观经济发布信息,以及五种关键美国金融资产的高频实时交易数据;和(3)一种基于LLM的反事实事件增强策略。我们将CAMEF与最先进的基于变换器的时间序列和多模态基线进行了比较,并进行了消融研究以验证因果学习机制和事件类型的有效性。
arXiv:2502.04591v1 声明类型:交叉
摘要:图形神经网络(GNNs)中的过度光滑化是一个根本性的挑战:随着层的数量增加,节点嵌入变得越来越相似,模型性能会急剧下降。传统上,过度光滑化是通过衡量相邻节点特征相似性的指标来量化,如狄利克雷能量。虽然这些指标与过度光滑化有联系,但我们认为它们存在关键的局限性,无法可靠地在现实场景中捕捉到过度光滑化。例如,它们只能在非常深的网络和在权重和特征表示的范数下部分条件下提供有意义的见解。作为替代方案,我们建议通过检查特征表示的数值秩或有效秩来测量过度光滑化。我们为这种方法提供了理论支持,证明在非负训练权重的假设下,对于一系列非线性激活函数,特征表示的数值秩会收敛到1。据我们所知,这是第一个证明过度光滑化发生的定理,没有任何关于权重矩阵有界性的假设。除了理论发现外,我们还在多种图形架构上进行了详尽的数值评估。我们的结果表明,基于秩的指标能一致地捕捉到过度光滑化,而基于能量的指标通常会失败。值得注意的是,我们揭示了特征表示秩的显著下降与性能下降紧密相关,即使在能量指标保持不变的情况下也是如此。
arXiv:2502.04580v1 标题类型: cross
摘要:Transformer模型展示出了 remarkable 的上下文内学习(ICL)能力,通过仅仅基于示例进行条件化调整而无需更新参数,即可适应新任务。实证和理论证据表明,作为一个通用的学习者,ICL 可能会优于针对特定任务的模型。然而,关于Transformer是否以最优方式进行上下文内学习,与原则性的学习算法相比仍不清楚。为了弥合这一差距,我们引入了一个新的框架来量化ICL作为学习算法在简化场景下的最优性。我们的研究发现揭示了一个引人注目的矛盾:虽然ICL最初与贝叶斯最优估计器的效率相当,但在长上下文中其效率显著下降。通过信息论分析,我们展示了效率下降是ICL固有的特点。这些结果阐明了使用ICL作为通用问题解决者的权衡,促进了新一代无需效率递减的即时适应方法。