LLM2D
关于接收器操作特性曲线和精确度-召回曲线的几何学
On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves
作者: Reza Sameni
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.02169v1

摘要

arXiv:2504.02169v1 宣告类型:交叉 摘要:我们研究了二分类问题中接收器操作特征(ROC)曲线和精确度-召回(PR)曲线的几何特性。主要发现是,许多常用的二分类度量指标都只是分类得分在正类和负类条件下的累计分布函数 $F_p(\cdot)$ 和 $F_n(\cdot)$ 组合函数 $G := F_p \circ F_n^{-1}$ 的函数。这种几何视角有助于选择操作点、理解决策阈值的效果,并比较不同分类器。它还能够解释ROC/PR曲线的形状和几何特性如何反映分类器的行为,从而提供在特定应用背景下的具体约束条件下优化分类器的客观工具。我们进一步探索了分类器主导的条件,展示了类可分性和方差对 ROC 和 PR 几何特性的影响的理论和数值示例,并推导出正类泄漏函数 $G(\cdot)$ 与克劳斯-勒布勒散度之间的关系。该框架突出了实际考量,如模型校准、成本敏感优化和在现实条件下的操作点选择,从而促进更明智的分类器部署和决策方法。