摘要
arXiv:2502.06811v2 通知类型: 替换-交叉
摘要:注意力,或是在不同信息项之间进行优先级排序的能力,是任何学习过程中的一个关键要素,无论是对人类还是机器。鉴于人类在某些学习任务上仍然超越机器,通过使机器的注意力机制与人类的注意力机制相一致来提升机器的表现似乎是合乎逻辑的——然而,关于这一领域的研究并不多且成果有限。本文提出了一种解决这一问题的新方法,称为人类-机器注意学习(HuMAL)。该方法依赖于人类标注的数据,以反映他们在特定任务中的自我感知注意力。我们使用情感分析任务(Yelp上的评论数据)和人格类型分类任务(myPersonality的数据)评估了几种将此类人类注意力数据整合到机器学习(ML)算法中的策略。表现最佳的HuMAL策略显著提高了微调的变压器模型(包括BERT、GPT-2和XLNET)的任务性能,并且在不平衡或稀疏标注数据的挑战条件下尤其明显。这项研究有助于加深对如何将人类注意力整合进ML模型策略的理解,并突显了利用人类认知来增强实际应用中的ML的潜力。