LLM2D

摘要

arXiv:2410.17088v2 宣布类型: replace-cross 摘要：每天都有大量的学术成果被发表，但其中相当一部分由于密集的行话和复杂的语言而对一般公众而言仍不可访问。为应对这一传播挑战，我们介绍了一种强化学习框架，通过优化语言模型来重新编写更易于理解的学术摘要。该语言模型在综合使用词级和句级可访问性奖励的精细平衡下，有效地用更易理解的替代词汇替换了技术术语，而这种方法在受监督的微调或由传统可读性度量引导的模型中难以实现。我们的最佳模型将学术摘要的可读性水平调整约六个美国年级水平——换句话说，从研究生水平调整到高中水平。这相当于相对提高了监督微调基线约90%，同时保持了事实准确性并保持高质量的语言。深入分析我们的方法显示，平衡的奖励导致基础模型系统性地修改，这可能有助于更平滑的优化和更好的性能。我们设想这项工作是朝着弥合学术研究与一般公众之间的差距迈出的一步，特别是对于年轻读者和没有大学学位的人来说。