LLM2D

摘要

本研究探讨了大型语言模型主动寻求用户支持的能力。我们提出了评估性能提升和用户负担之间权衡的指标，并研究了大型语言模型是否能够在信息可用性不同的情况下确定何时需要帮助。我们的实验表明，在没有外部反馈的情况下，许多大型语言模型难以识别它们对用户支持的需求。这些发现突出了外部信号的重要性，并为未来关于改进寻求支持策略的研究提供了见解。源代码：https://github.com/appier-research/i-need-help