LLM2D
见偏见: 一个全面的工具,用于评估和可视化AI公平性
seeBias: A Comprehensive Tool for Assessing and Visualizing AI Fairness
作者: Yilin Ning, Yian Ma, Mingxuan Liu, Xin Li, Nan Liu
发布日期: 4/14/2025
arXiv ID: oai:arXiv.org:2504.08418v1

摘要

arXiv:2504.08418v1 交叉公告类型 摘要:人工情报(AI)预测模型中的公平性日益受到重视,以支持在其如医疗保健和刑事司法等高风险领域负责任的应用。指南和实施框架强调了准确预测和公平结果的重要性。然而,当前的公平性工具包往往孤立地评估分类性能差异,对校准等其他关键方面关注不足。为了弥补这些不足,我们介绍了seeBias,这是一个用于全面评估模型公平性和预测性能的R包。seeBias提供了一个集成的评估,涵盖了分类、校准以及其他性能领域,提供了对模型行为的更完整视图。它包括可自定义的可视化工具,支持透明报告和负责任的人工智能实施。使用来自刑事司法和医疗保健的公开数据集,我们展示了seeBias如何支持公平性评估,并揭示了传统公平性指标可能忽视的差异。该R包可在GitHub上获得,同时正在开发Python版本。