摘要
arXiv:2504.20505v1 宣言类型: 新
摘要: 近期在大型语言模型(LLMs)方面的进展展示了其在使用环境传感器进行人类活动识别(HAR)过程中表现出的有希望的潜力,特别是在自然语言推理和零样本学习方面。然而,现有的数据集,如CASAS、ARAS和MARBLE,最初并不是为了LLMs设计的,因此缺乏充分利用LLMs能力所需的上下文丰富性、复杂性和注释粒度。在本文中,我们介绍了MuRAL,这是一个包含多住户环境中的多用户传感器数据的首个带有自然语言描述的多住户外设传感器数据集,数据涵盖来自21个会话的超过21小时的传感器数据。MuRAL被细粒度地标注以自然语言描述、住户身份和高层次的活动标签,所有这些标签都置于动态的、现实的多住户环境中。我们使用最先进的LLMs对MuRAL进行了三项核心任务的基准测试:主题分配、动作描述和活动分类。我们的结果表明,虽然LLMs能够为环境数据提供丰富的语义解释,但当前的模型仍然面临处理多用户模糊性和传感器上下文不足的挑战。我们推出MuRAL,以支持未来LLM驱动的、可解释的和社会意识强的智能环境中的人类活动理解的研究。要获取数据集,请通过提供的联系方式联系我们。数据集检索的直接链接将在适当时候在此处提供。