LLM2D

时间迁移：无限数据极限下的最优学习率和批次大小

Time Transfer: On Optimal Learning Rate and Batch Size In The Infinite Data Limit

作者: Oleg Filatov, Jan Ebert, Jiangtao Wang, Stefan Kesselheim

发布日期: 10/10/2024

arXiv ID: oai:arXiv.org:2410.05838v1

大型语言模型（LLM）在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别（NER）中，现有的基于 LLM 的方法...