LLM2D

摘要

arXiv:2410.13727v2 宣告类型: replace-cross 摘要：对话通常遵循跨文化之间不同的社交规范。例如，在西方，“称呼父母名字”是常见的做法，而在大多数亚洲文化中却很少见。这些规范的遵守或违反往往会决定对话的基调。人类能够在需要文化意识的情境中相当熟练地应对社交情况。然而，对于NLP模型来说，这是一个艰巨的任务。在本文中，我们通过引入一种“文化上下文模式”来解决这个问题。该模式包括：(1) 会话信息，如情感、对话行为等，以及(2) 文化信息，如社交规范、违反规范等。我们使用大语言模型（LLM）生成了约23,000场对话的约11万个社交规范和违反规范的描述。我们使用自动验证策略对这些描述进行优化，并用文化敏感的人类判断进行评估。我们将这些描述组织成有意义的结构，称为“规范概念”，使用一种互动式的人机闭环框架。我们通过符号注释将规范概念和描述与会话联系起来。最后，我们使用获得的数据集进行后续任务，如情感、情绪和对话行为检测。我们证明这种方法大大提高了实证性能。