LLM2D
关于ChatGPT在教学韩国数学中的鲁棒性研究
On the robustness of ChatGPT in teaching Korean Mathematics
作者: Phuong-Nam Nguyen, Quang Nguyen-The, An Vu-Minh, Diep-Anh Nguyen, Xuan-Lam Pham
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11915v1

摘要

arXiv:2502.11915v1 宣布类型: 新论文 摘要:ChatGPT 是一个人工智能模型,有可能彻底改变教育领域。然而,它解决非英语问题的效果仍然存在不确定性。本研究使用 586 道韩国数学题评估了 ChatGPT 的鲁棒性。ChatGPT 的准确率为 66.72%,正确回答了其中的 391 道题目。我们还根据 eleven 个标准评估了它对数学题的评分能力,并进行了主题分析。我们的研究结果表明,ChatGPT 的评分与教育理论和应试者观点相符。虽然 ChatGPT 在问题分类方面表现良好,但在非英语环境中却遇到困难,这指出了改进的领域。未来的研究应解决语言偏见,并提高其在多种语言中的准确性。针对特定领域的优化和多语言训练可以改进 ChatGPT 在个性化教育中的作用。