LLM2D

摘要

arXiv:2504.08418v1 交叉公告类型摘要：人工情报（AI）预测模型中的公平性日益受到重视，以支持在其如医疗保健和刑事司法等高风险领域负责任的应用。指南和实施框架强调了准确预测和公平结果的重要性。然而，当前的公平性工具包往往孤立地评估分类性能差异，对校准等其他关键方面关注不足。为了弥补这些不足，我们介绍了seeBias，这是一个用于全面评估模型公平性和预测性能的R包。seeBias提供了一个集成的评估，涵盖了分类、校准以及其他性能领域，提供了对模型行为的更完整视图。它包括可自定义的可视化工具，支持透明报告和负责任的人工智能实施。使用来自刑事司法和医疗保健的公开数据集，我们展示了seeBias如何支持公平性评估，并揭示了传统公平性指标可能忽视的差异。该R包可在GitHub上获得，同时正在开发Python版本。