LLM2D

摘要

arXiv:2502.07250v1 类型: cross 摘要: 当前的机器学习模型在短跨度感知任务中表现出色，但在从长期观察中提取高层次见解方面能力不足，这种能力是理解复杂事件（CEs）的核心。CEs 被定义为由时空规则支配的短期原子事件（AEs）序列，由于需要从长且嘈杂的传感器数据中提取有意义的模式并忽略无关事件，因此很难在线检测 CEs。我们假设基于状态的方法非常适合 CE 检测，因为这些方法通过状态转换捕捉事件进展，而不需要长期记忆。基准实验验证了这一点，表明状态空间模型 Mamba 超过了现有架构。然而，Mamba 对大量标记数据的依赖性，而这些数据难以获取，促使我们提出了第二个假设：将 CE 规则学习与嘈杂的传感器数据脱钩可以减少数据需求。为了解决这个问题，我们提出了 NARCE，这是一种框架，将神经算法推理（NAR）结合进来，将任务分为两个组成部分：（i）使用生成概念轨迹的大型语言模型（LLMs）独立于传感器数据学习 CE 规则；（ii）通过适配器将传感器输入映射到这些规则。我们的结果表明，NARCE 在准确性、对未见和更长传感器数据的泛化能力以及数据效率方面超过了基线方法，显著降低了注释成本并推进了稳健的 CE 检测。