摘要
arXiv:2502.02072v1 声明类型:交叉
摘要:大型语言模型(LLMs)的快速进化已经改变了自然语言处理,但这也引发了关于部署和使用这些模型时固有的偏见在多种语言和社会文化背景下带来的关键担忧。本文提出了一种名为ASCenD BDS(适配性、随机性和情境感知的偏见、歧视和刻板印象检测框架)的框架。该框架提供了一种在性别、种姓、年龄、残疾、社会经济地位、语言变体等各种类别中检测偏见、歧视和刻板印象的方法,使用的是适配性、随机性和情境感知的方法。当前的框架超越了现有框架的局限性,包括适应性、随机性和情境感知的特征。情境感知可以为任何国家、文化或亚文化自定义,例如组织的独特文化。在本文中,该框架在印度的情境中得到了验证。内容基于2011年印度人口普查进行了分类。通过类别、子类别、STEM、X因素、同义词的框架,实现适应性、随机性和情境感知的特征。该框架在第3节中详细描述。总体而言,由圣狐咨询有限公司的咨询团队开发了800多个STEM,10个类别,31个独特的子类别。作为产品开发的一部分,该概念在SFCLabs进行了测试。