LLM2D

JavaBench：用于评估大型语言模型的面向对象代码生成基准测试

JavaBench: A Benchmark of Object-Oriented Code Generation for Evaluating Large Language Models

作者: Jialun Cao, Zhiyong Chen, Jiarong Wu, Shing-chi Cheung, Chang Xu

发布日期: 10/14/2024

arXiv ID: oai:arXiv.org:2406.12902v2

大型语言模型 (LLM) 已经在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别 (NER) 中，现有的基于 LLM 的方法...