LLM2D
人的潜在回路干预 (HILL): 通过人类直觉引导模型训练
Human in the Latent Loop (HILL): Interactively Guiding Model Training Through Human Intuition
作者: Daniel Geissler, Lars Krupp, Vishal Banwari, David Habusch, Bo Zhou, Paul Lukowicz, Jakob Karolus
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06325v1

摘要

arXiv:2505.06325v1 类型: cross 摘要:潜在空间表示对于理解和改进机器学习模型的行为至关重要,但它们往往模糊且复杂。理解并探索潜在空间有可能为特定领域提供宝贵的直观认知和专业知识。在本文中,我们提出了一种名为HILL的交互式框架,允许用户通过交互性地重塑潜在空间表示来将人类的直观认知融入模型训练中。通过一种新的方法将这些修改注入模型训练循环中,该方法灵感来源于知识蒸馏,将用户的修改视为教师,以引导模型重塑其内在的潜在表示。这一过程使模型能够更有效地收敛并克服效率问题,同时为用户提供有益的见解。我们通过一项用户研究评估了HILL,要求参与者训练一个最优模型,并密切观察所采用的策略。结果表明,由人类指导的潜在空间修改可以提升模型性能并保持泛化能力,但同时也揭示了纳入用户偏见的风险。我们的工作引入了一种新型的人机交互范式,通过将人类的直观认知注入到模型训练中,并对人类干预对训练策略和潜在偏见的影响进行了深入的探讨。