LLM2D
时间迁移:无限数据极限下的最优学习率和批次大小
Time Transfer: On Optimal Learning Rate and Batch Size In The Infinite Data Limit
作者: Oleg Filatov, Jan Ebert, Jiangtao Wang, Stefan Kesselheim
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.05838v1

摘要

大型语言模型(LLM)在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别(NER)中,现有的基于 LLM 的方法...