LLM2D
自然语言概要代码:大语言模型时代的情�动人声编程
Natural Language Outlines for Code: Literate Programming in the LLM Era
作者: Kensen Shi, Deniz Alt{\i}nb\"uken, Saswat Anand, Mihai Christodorescu, Katja Gr\"unwedel, Alexa Koenings, Sai Naidu, Anurag Pathak, Marc Rasi, Fredde Ribeiro, Brandon Ruffin, Siddhant Sanyam, Maxim Tabachnyk, Sara Toth, Roy Tu, Tobias Welp, Pengcheng Yin, Manzil Zaheer, Satish Chandra, Charles Sutton
发布日期: 4/17/2025
arXiv ID: oai:arXiv.org:2408.04820v3

摘要

arXiv:2408.04820v3 通知类型: 替换-交叉 摘要:我们提出使用自然语言目录作为为开发人员在整个软件开发过程中提供AI辅助的新颖模态和交互表面。代码函数的自然语言目录包含用简洁的文字编写的多个语句,将代码分隔并以文档化编程的风格总结其主要内容。关键的是,我们发现现代语言模型在实践中可以生成准确且高质量的自然语言目录。此外,自然语言目录使代码和自然语言之间实现了双向同步:开发人员可以更改其中之一,而语言模型会自动更新另一个。我们讨论了许多自然语言目录的使用案例:它们可以加速代码和差异的了解和导航,简化代码维护,增强代码搜索,引导代码生成等。然后我们提出了几种生成目录的语言模型提示技术,并让专业开发人员判断目录的质量。最后,我们介绍了两个案例研究,将自然语言目录应用于代码审查和恶意软件检测。