LLM2D
EduBot — LLMs能解决个性化学习和编程作业的问题吗?
EduBot -- Can LLMs Solve Personalized Learning and Programming Assignments?
作者: Yibin Wang, Jiaxi Xie, Lakshminarayanan Subramanian
发布日期: 4/28/2025
arXiv ID: oai:arXiv.org:2504.17824v1

摘要

arXiv:2504.17824v1 宣传类型:交叉 摘要:大型语言模型(LLMs)的普及正在彻底改变编写代码的过程。通用和代码LLMs在单次查询下生成独立函数和代码完成任务方面表现出色。然而,使用递归请求和错误修复解决综合编程任务的能力仍有待商榷。在本文中,我们提出了EduBot,这是一个结合概念知识教学、端到端代码开发、递归提示驱动的个性化编程以及用LLMs支持有限的人工干预进行调试的智能自动化助手系统。我们展示了EduBot可以通过递归自动提示驱动系统解决包含从概念到编码问题逐难度递增的子任务的复杂编程任务,而无需对LLMs本身进行微调。为了进一步评估EduBot的性能,我们设计并实施了一个基准测试套件,其中包括20个算法、机器学习和实际问题场景。结果显示,EduBot可以在不到20分钟内完成大多数场景。基于该基准测试套件,我们进行了一个比较研究,将不同的LLMs作为骨干,并验证EduBot在不同能力LLMs中的兼容性和鲁棒性。我们认为,EduBot是一种探索性方法,用于探索预训练LLMs在多步推理和代码生成方面解决个性化作业(结合知识学习和代码生成)的潜力。