LLM2D

摘要

arXiv:2504.00860v1 宣告类型：跨领域摘要：尽管已经作出了众多努力来减轻它们的偏见，机器学习系统仍然继续对已经处于不利地位的人群造成伤害。虽然主流的机器学习方法假设可以消除偏见并创建公平模型，但我们表明，并非总能做到这一点，也不是一个值得追求的目标。我们通过创建模型来识别偏见语言，重新定义机器学习偏见问题，将注意力集中在数据集的偏见上，而不是试图消除它们。然后，通过一个研讨会，我们评估了这些模型在特定用例中的效果：信息和文化遗产专业人士的工作流程。我们的发现表明，由于机器学习的上下文性质，识别偏见的限制，以及缓解偏见的方法可能同时惠及和压迫不同的社区，因此不可避免。我们展示了扩展机器学习方法以处理偏见和公平性的必要性，提供了一种混合方法来调查在特定机器学习用例中消除偏见或实现公平性的可行性。