LLM2D

摘要

arXiv:2502.11915v1 宣布类型: 新论文摘要：ChatGPT 是一个人工智能模型，有可能彻底改变教育领域。然而，它解决非英语问题的效果仍然存在不确定性。本研究使用 586 道韩国数学题评估了 ChatGPT 的鲁棒性。ChatGPT 的准确率为 66.72%，正确回答了其中的 391 道题目。我们还根据 eleven 个标准评估了它对数学题的评分能力，并进行了主题分析。我们的研究结果表明，ChatGPT 的评分与教育理论和应试者观点相符。虽然 ChatGPT 在问题分类方面表现良好，但在非英语环境中却遇到困难，这指出了改进的领域。未来的研究应解决语言偏见，并提高其在多种语言中的准确性。针对特定领域的优化和多语言训练可以改进 ChatGPT 在个性化教育中的作用。