LLM2D
教育文献的差异化特征:基于Transformer和计算语言学的跨模态融合方法
What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics
作者: Jordan J. Bird
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2411.17593v1

摘要

将新文学融入英语课程仍然是一个挑战,因为教育者往往缺乏可扩展的工具来快速评估可读性和根据不同的课堂需求调整文本。本研究提出通过一种多模态方法来解决这一差距,该方法结合基于转换器的文本分类和语言特征分析,以使文本与英国关键阶段对齐。八个最先进的Transformer模型在分段文本数据上进行了微调,其中BERT实现了最高的单模态F1分数0.75。同时,搜索了500种深度神经网络拓扑结构来对语言特征进行分类,实现了0.392的F1分数。这些模态的融合显示出显著的改进,所有多模态方法都优于所有单模态模型。特别是,ELECTRA Transformer与神经网络融合后,实现了0.996的F1分数。该方法最终被封装在一个面向利益相关者的网络应用程序中,为非技术利益相关者提供对文本复杂性、阅读难度、课程对齐以及学习年龄范围建议的实时洞察。该应用程序通过将基于人工智能的建议整合到英语文学的课程计划中,从而增强数据驱动的决策能力并减少人工工作量。