arXiv:2505.09935v1 类型: cross
摘要:在复杂的城市交叉口环境中理解并预测人类行为,特别是预测弱势道路使用者(VRUs)的穿越意图,对于提高道路使用者之间的互动安全性至关重要。其中最为关键的行为是VRUs的穿越意图,因为对其误解可能会导致与对向车辆发生危险冲突。在本研究中,我们提出了一种名为VRU-CIPI的框架,其中包含了一个基于顺序注意力的模型,用于预测交叉口处VRUs的穿越意图。VRU-CIPI使用门控循环单元(GRU)来捕捉VRUs运动的时序动态,并结合多头Transformer自注意力机制来编码预测穿越方向时至关重要的上下文和空间依赖关系。在UCF-VRU数据集上进行评估,我们的方法达到了最先进的性能,准确率为96.45%,并实现了每秒33帧的实时推理速度。此外,通过与基础设施到车辆(I2V)通信的集成,我们的方法可以通过及时激活穿越信号并在连接车辆中提供早期警告,从而主动提升交叉口的安全性,确保所有道路使用者之间的更顺畅和更安全的互动。
arXiv:2505.09926v1 宣布类型: cross
摘要: 全局视觉异常检测旨在无需额外微调的情况下,从新的或未见过的视觉领域中识别异常,这对于开放场景至关重要。近期研究表明,像CLIP这样的预训练视觉-语言模型仅使用少量或几幅正常图像就能展现出强大的泛化能力。然而,现有方法在设计提示模板、处理复杂标记交互或要求额外微调方面存在困难,导致灵活性有限。本文基于两个关键洞察介绍了简单且有效的方法——AdaptCLIP。首先,视觉和文本表示应该交替学习,而不是联合学习。其次,在查询和正常图像提示之间的比较学习应该同时包含上下文和对齐的残差特征,而不仅仅是依赖残差特征。AdaptCLIP将CLIP模型视为基础服务,在输入或输出端仅添加三个简单的适配器:视觉适配器、文本适配器和提示-查询适配器。AdaptCLIP在训练有素的基础上,对目标领域具有无需训练的方式实现跨领域的零样本/少样本泛化。AdaptCLIP在12个来自工业和医学领域的异常检测基准上取得了最好的性能,大幅优于现有的竞争方法。我们将将在https://github.com/gaobb/AdaptCLIP发布AdaptCLIP的代码和模型。
arXiv:2505.09925v1 交互持续学习类型:跨学科
摘要:本文介绍了一种交互式持续学习范式,其中AI模型通过实时人类反馈动态学习新技能,同时保留先前的知识。该范式独特地解决了传统持续学习的两大主要局限性:(1)使用流式、实时人类标注数据进行动态模型更新,而非固定标签的静态数据集,以及(2)通过明确处理常见的嘈杂反馈来应对干净标签的假设。为了应对这些问题,我们提出了一种RiCL框架,利用大型语言模型(LLMs)从动态反馈中有效地学习新技能。RiCL包含三个关键组件:一种时间一致性意识净化器,能够自动区分数据流中的干净样本与嘈杂样本;一种交互意识直接偏好优化策略,通过调和AI生成和人类提供的反馈来使模型行为与人类意图保持一致;以及一种噪声耐受对比学习模块,通过利用固有的数据关系捕捉稳健的表示,从而避免依赖可能不可靠的标签。在两个基准数据集(FewRel和TACRED)上进行的实验表明,我们的RiCL方法在存在现实噪声模式污染的情况下,显著优于现有最先进的在线持续学习和嘈杂标签学习方法的组合。
arXiv:2505.09907v1 交叉公告类型
摘要:随着对健康食品需求的增长,农产品价格预测变得越来越重要。哈斯牛油果作为一种高价值作物,其价格波动受到季节性、地区和天气等因素的复杂影响。传统的预测模型往往难以处理高度非线性和动态的数据。为了解决这一问题,我们提出了一种混合深度学习模型——TCN-MLP-Attention 架构,结合了时序卷积网络(TCN)进行序列特征提取、多层感知机(MLP)进行非线性交互以及注意力机制进行动态特征加权。所使用的数据集覆盖了2015年至2018年美国哈斯牛油果销售的超过50,000条记录,其中包括销售量、平均价格、时间、地区、天气和品种类型等变量,这些数据来源于销售点系统和哈斯牛油果委员会。经过系统的预处理,包括缺失值填充和特征规范化后,提出的模型进行了训练和评估。实验结果表明,TCN-MLP-Attention 模型在预测性能上表现出色,其 RMSE 为 1.23,MSE 为 1.51,优于传统方法。该研究为农产品市场的时间序列预测提供了一种可扩展且有效的方法,并为智能供应链管理和价格策略优化提供了有价值的见解。
arXiv:2505.09901v1 交叉公告类型:cross
摘要:大型语言模型(LLMs)越来越多地用于在复杂的序列决策任务中模拟或自动化人类行为。一个自然的问题是LLMs的决策行为是否类似人类,并且能否达到相当(或更优)的性能。在本文中,我们专注于探索与利用(E&E)权衡,这是在不确定性下动态决策的基本方面。我们采用认知科学和精神病学文献中引入的经典多臂_bandit(MAB)任务,对LLMs、人类和MAB算法的E&E策略进行比较研究。我们使用可解释的选择模型来捕捉代理的E&E策略,并探讨显式推理,通过提示策略和推理增强的模型,如何影响LLMs的决策。我们发现,推理使LLMs朝向更具人类特征的行为转变,表现为随机探索和定向探索的混合。在简单的稳定任务中,具有推理功能的LLMs在随机探索和定向探索方面与人类表现出相似的水平。然而,在更复杂、非稳定环境中,尽管在某些情况下埐的悔恨程度相似,LLMs在有效定向探索方面难以与人类匹配。我们的发现突显了LLMs作为人类行为模拟和自动化决策工具的潜力和局限,并指出了改进的潜在领域。
arXiv:2505.09868v1 类别: cross
摘要:尽管有个美国宪法的基础,技术上的“个体公平”标准在州级或联邦的法律/规章中仍未得到具体化。我们进行了一项人类受试者实验以弥补这一缺口,评估哪些人口统计特征对于再犯风险评估(RRA)工具的个体公平性评估是相关的。我们的分析结论是,个体相似性函数应考虑年龄和性别,但不应考虑种族。
arXiv:2505.09861v1 跨类别公告类型
摘要:数据驱动归因是一种基于从数据中学习到的因果模式来将转化归因于营销互动的方法,它是现代营销智能的基础,并对任何营销企业和广告平台至关重要。在本文中,我们介绍了一种统一的基于变换器的归因方法,该方法能够处理成员级数据、聚合级数据,并集成外部宏观因素。我们详细介绍了该方法在领英的大规模实施情况,展示了其显著影响。我们还分享了广泛适用于营销和技术广告领域的学习和见解。
arXiv:2505.09855v1 共享类型: 交叉
摘要: 变址模型通过两种不同的模式进行学习:权重内部学习(IWL),将知识编码到模型权重中,以及上下文内部学习(ICL),在无需修改权重的情况下灵活适应上下文。为了更好地理解这些学习模式之间的相互作用,我们从进化生物学中类似适应策略中汲取灵感:遗传编码(类似于IWL,在多个世代和个体的一生中固定)和表型可塑性(类似于ICL,在遇到环境线索时提供灵活的行为响应)。在进化生物学中,环境的可预测性决定了这些策略之间的平衡:稳定性倾向于遗传编码,而可靠的预测线索促进表型可塑性。我们通过实验手段操作这些可预测性的维度,并系统地调查它们对Transformer中ICL/IWL平衡的影响。通过回归和分类任务,我们展示出,在最大的稳定性下,环境的高稳定性确实倾向于IWL,符合预期,伴随着向最稳定状态的急剧转变。相反,高线索可靠性可以增强ICL的效用,尤其是在稳定性较低的情况下。此外,学习动态揭示了任务特定的时间演化:虽然在某些环境中(如多类分类)可以观察到经典的ICL向IWL转变,但我们证明,在IWL较容易(如较少的类)或ICL获取较慢(如回归)的情况下,可以表现出最初以IWL为主导,随后转变为ICL主导的初始阶段。这些发现支持了对这些学习模式转换的相对成本假设,确立了可预测性是控制Transformer中适应策略的关键因素,为理解和指导ICL提供了新见解,并为指导训练方法提供了新的启示。
arXiv:2505.09852v1 交叉公告类型
摘要:大语言模型(LLMs)在自然语言任务中展现了令人印象深刻的性能,但它们预测暴力冲突的能力尚未得到充分探索。我们研究LLMs在其预训练权重中是否蕴含了可用于预测冲突升级和伤亡的有意义的参数性知识,而无需外部数据。这对于早期预警系统、人道主义规划和政策制定至关重要。我们将这种参数性知识与非参数性能力进行了比较,在非参数性能力中,LLMs通过检索增强生成(RAG)访问冲突数据集(例如ACLED、GDELT)和最近的新闻报告中的结构化和非结构化上下文。结合外部信息可以增强模型性能,提供预训练权重中缺失的最新上下文。我们的双阶段评估框架覆盖了2020年至2024年,研究区域包括非洲之角和中东的冲突高发区。在参数性设置中,LLMs仅依靠预训练知识预测冲突趋势和伤亡。在非参数性设置中,模型接收近期冲突事件、指标和地缘政治发展的摘要。我们将预测的冲突趋势标签(例如:升级、稳定冲突、降级、和平)和伤亡情况与历史数据进行对比。我们的发现突显了LLMs在冲突预测方面的优点和局限性,以及与结构化外部知识相结合的好处。
arXiv:2505.09847v1 类型: cross
摘要:销售过程涉及销售功能将潜在客户或机会转化为实际客户,并向现有客户销售更多产品。因此,销售过程的优化是任何B2B业务成功的关键。在本文中,我们介绍了一种 principled 的销售优化和商业人工智能方法,即因果预测优化与生成,该方法包括三层:1) 负责因果机器学习的预测层;2) 负责约束优化和上下文多臂布局的优化层;3) 负责生成人工智能和系统增强反馈环路的服务层。我们详细介绍了该系统在领英中的实现和部署情况,展示了其相较于传统系统的显著优势,并广泛分享了相关经验和见解,这些经验对这一领域具有普遍适用性。