摘要
arXiv:2406.09496v3 宣告类型: replace-cross
摘要:我们介绍了世界万维菜谱,其中提出了一个文化意识和参与性的数据收集框架,并由此产生了地区多样的世界万维菜肴评估数据集。我们还分析了偏见的操作化,以突出当前系统在多个维度上的表现不佳:准确性和误代表性,以及文化敏感性和不敏感性,并附有来自定性社区观察和定量自动化工具的证据。我们发现,这些从文本到图像(T2I)模型通常不生成特定于各种地区的菜肴质量输出。即使对于通常被认为在训练数据方面更为资源丰富的美国,也是如此——尽管美国菜肴的生成表现优于调查的非洲国家。这些模型展示了生成不准确、文化误代表性、单一化和不敏感输出的倾向。这些表现性偏见有可能进一步强化刻板印象,并不成比例地导致地区背景下的抹除。数据集和代码可在 https://github.com/oxai/world-wide-dishes 获取。