LLM2D

摘要

arXiv:2505.04851v1 宣告类型: new 摘要: 尽管流行的文本到图像生成模型在处理国际和通用文化查询方面表现出色，但在处理个体文化方面存在显著的知识空白。这归因于现有大量网络收集的训练数据集，这些数据集主要基于西方欧洲或美国流行文化。同时，模型的文化适应性不足可能导致结果错误、生成质量下降以及刻板印象和冒犯性内容的传播。为了应对这一问题，我们研究了文化代码的概念，并认识到理解现代图像生成模型对该概念的重要性，这是目前研究社区尚未充分关注的问题。我们提出了收集和处理数据的方法，以形成基于文化代码的数据集，特别是俄罗斯文化代码。我们探讨了收集的数据如何影响国家领域内的生成质量，并使用Kandinsky 3.1文本到图像模型分析我们方法的有效性。人类评估结果表明，模型对俄罗斯文化的认知水平有所提高。