LLM2D

摘要

arXiv:2504.01798v1 通知类型: 新摘要: 泰斯林机（TM）是一种基于命题逻辑的模型，通过合取子句来学习数据中的模式。与典型的神经网络一样，泰斯林机的性能很大程度上取决于其参数数量，更多的参数可以提高准确性但会降低执行速度。在神经网络中，知识蒸馏是将已经训练好的教师模型的信息转移到较小的学生模型中，以提高学生模型的准确性而不增加执行时间。我们提出了一种在泰斯林机中实现知识蒸馏的新方法，通过利用教师每个输出样本的概率分布，为学生提供额外的上下文信息。此外，我们提出了一种新的子句转移算法，该算法权衡了教师中每个子句的重要性，并用最必要的数据初始化学生模型。我们的算法在测试的图像识别和文本分类领域中能够显著提高学生模型的性能，而不会对延迟产生负面影响。