LLM2D
解码神秘填字游戏:基于语义的复杂文字游戏谜题作为NLP的目标
Decrypting Cryptic Crosswords: Semantically Complex Wordplay Puzzles as a Target for NLP
作者: Josh Rozner, Christopher Potts, Kyle Mahowald
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2104.08620v4

摘要

arXiv:2104.08620v4 Announce Type: replace-cross 摘要:密谜填字在英国占据主导地位,是推进处理语义复杂、高度组合语言的NLP系统的有前途的目标。密谜线索看起来像流畅的自然语言,但对抗性地由两部分组成:定义和需要字符级操作的字话密码。专家人类使用创造性的智能来解决密谜,灵活地结合语言知识、世界知识和领域知识。在这篇论文中,我们做出了两项主要贡献。首先,我们提出了一组密谜线索作为挑战性的新基准,用于寻求以更创作、更人性化的方式处理组合语言的NLP系统。在展示三种非神经网络方法和最先进的神经语言模型T5均未能取得良好性能后,我们做出了第二项主要贡献:一种新颖的阶梯式方法,其中模型首先在诸如消字词这样相关的任务上进行微调。我们还引入了一个具有挑战性的数据划分方法,研究了子词标记模型的元语言能力,并通过干扰线索中的字话部分探索模型的系统性,展示了T5的行为部分与人类解谜策略一致。尽管我们的阶梯式方法在T5基线上取得了显著的改进,但我们的最佳模型仍然无法像人类那样进行泛化。因此,密谜填字仍然是NLP系统未解决的挑战,并且是一个潜在的未来创新来源。