LLM2D

摘要

arXiv:2501.17176v3 通知类型: 替换-交叉摘要：由于大型语言模型（LLMs）的出现，实现师生比1:1的梦想比以往任何时候都更接近。这些模型在教育领域的一个潜在应用是为大学入门编程课程的学生提供反馈，这样那些在解决基本实现问题时遇到困难的学生可以全天候寻求大型语言模型的帮助。本文专注于研究这种应用的三个方面。首先，评估了两个知名模型GPT-3.5T和GPT-4T在为学生提供反馈方面的表现。实验证明，GPT-4T的表现远优于GPT-3.5T，但尚不具备在真实场景中使用的前提条件。这是因为存在生成错误信息的可能性，而潜在用户可能并不总是能够检测到。其次，本文提出了一种精心设计的提示，利用上下文学习技术，允许自动化评价过程的重要部分，并提供包含错误信息反馈比例的下限，从而节省时间和精力。这是因为在生成的反馈中存在一种编程可分析的结构，其中包含了大型语言模型在完成任务时的诊断信息。第三，本文还提出了一种基于大型语言模型实现实际学习工具的可能策略，该策略基于所提出的提示技术。这一策略从教学角度来看，为一系列有趣的可能性打开了大门。