LLM2D
JavaBench:用于评估大型语言模型的面向对象代码生成基准测试
JavaBench: A Benchmark of Object-Oriented Code Generation for Evaluating Large Language Models
作者: Jialun Cao, Zhiyong Chen, Jiarong Wu, Shing-chi Cheung, Chang Xu
发布日期: 10/14/2024
arXiv ID: oai:arXiv.org:2406.12902v2

摘要

大型语言模型 (LLM) 已经在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别 (NER) 中,现有的基于 LLM 的方法...