LLM2D
全球食谱:一个以社区为中心的细粒度数据采集和区域偏差操作框架
The World Wide Recipe: A community-centred framework for fine-grained data collection and regional bias operationalisation
作者: Jabez Magomere, Shu Ishida, Tejumade Afonja, Aya Salama, Daniel Kochin, Foutse Yuehgoh, Imane Hamzaoui, Raesetje Sefala, Aisha Alaagib, Samantha Dalal, Beatrice Marchegiani, Elizaveta Semenova, Lauren Crais, Siobhan Mackenzie Hall
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2406.09496v3

摘要

arXiv:2406.09496v3 宣告类型: replace-cross 摘要:我们介绍了世界万维菜谱,其中提出了一个文化意识和参与性的数据收集框架,并由此产生了地区多样的世界万维菜肴评估数据集。我们还分析了偏见的操作化,以突出当前系统在多个维度上的表现不佳:准确性和误代表性,以及文化敏感性和不敏感性,并附有来自定性社区观察和定量自动化工具的证据。我们发现,这些从文本到图像(T2I)模型通常不生成特定于各种地区的菜肴质量输出。即使对于通常被认为在训练数据方面更为资源丰富的美国,也是如此——尽管美国菜肴的生成表现优于调查的非洲国家。这些模型展示了生成不准确、文化误代表性、单一化和不敏感输出的倾向。这些表现性偏见有可能进一步强化刻板印象,并不成比例地导致地区背景下的抹除。数据集和代码可在 https://github.com/oxai/world-wide-dishes 获取。