摘要
arXiv:2410.13727v2 宣告类型: replace-cross
摘要:对话通常遵循跨文化之间不同的社交规范。例如,在西方,“称呼父母名字”是常见的做法,而在大多数亚洲文化中却很少见。这些规范的遵守或违反往往会决定对话的基调。人类能够在需要文化意识的情境中相当熟练地应对社交情况。然而,对于NLP模型来说,这是一个艰巨的任务。
在本文中,我们通过引入一种“文化上下文模式”来解决这个问题。该模式包括:(1) 会话信息,如情感、对话行为等,以及(2) 文化信息,如社交规范、违反规范等。我们使用大语言模型(LLM)生成了约23,000场对话的约11万个社交规范和违反规范的描述。我们使用自动验证策略对这些描述进行优化,并用文化敏感的人类判断进行评估。我们将这些描述组织成有意义的结构,称为“规范概念”,使用一种互动式的人机闭环框架。我们通过符号注释将规范概念和描述与会话联系起来。最后,我们使用获得的数据集进行后续任务,如情感、情绪和对话行为检测。我们证明这种方法大大提高了实证性能。