LLM2D

摘要

arXiv:2503.23231v1 Announce Type: cross 摘要：与代码生成不同，代码补全专注于将新的代码行或代码块集成到现有的代码库中。这个过程需要深入了解周围的上下文，例如变量作用域、对象模型、API 调用和数据库关系，以产生准确的结果。这些复杂的上下文依赖关系使代码补全成为一个特别具有挑战性的问题。当前的模型和方法往往无法有效地整合这些上下文，导致准确性较低（约为30%）的代码补全结果。对于数据转移这类高度依赖特定关系和数据结构的任务，接受率甚至会更低。这项研究引入了CCCI，一种专门针对数据转移任务生成上下文感知代码补全的新方法。通过将数据库表关系、对象模型和库细节等上下文信息整合到大型语言模型（LLMs）中，CCCI 提高了代码补全的准确性。我们使用了来自819个工业环境操作脚本的289个Java片段进行评估。结果表明，CCCI 达到了49.1%的构建通过率和41.0%的CodeBLEU分数，与那些在复杂任务完成方面经常出现问题的先进方法相当。