LLM2D

摘要

arXiv:2407.11004v2 宣告类型: replace-cross 摘要：大型预训练模型可以作为注释员使用，帮助替换或补充群众工作者，并使通用模型能够提炼为更小的专业模型。不幸的是，这需要付出一定的代价：使用顶级模型通常需要支付数千美元的API调用费用，而生成的数据集往往是静态的，并且难以审查。为了应对这些挑战，我们提出一个简单的替代方案：而不是直接查询预训练模型的标签，我们让模型生成可以生成标签的程序。这些程序可以本地存储和应用，可以重复使用和扩展，并且成本比传统方法低得多。我们的系统Alchemist在各种任务中取得了与基于大型语言模型的注释相当甚至更好的性能，成本仅为原有的一小部分：平均而言，改进幅度达到了12.9%，而在所有数据集上的总注释成本降低了大约500倍。