在医疗领域,经常需要做的不仅仅是模型准确率高就可以了,更多的是需要查全率要高于查准率,这样使更多的患者被检测到。因此通过P_R曲线来选择合适的模型阈值来做分类。P-R曲线就是精确率precision vs 召回率recall 曲线,以recall作为横坐标轴,precision作为纵坐标轴。通常随着分类阈值从大到小变化(大于阈值认为P),查准率减小,查全率增加。比较两个分类器好坏时,显然是查得又准又全的比较好,也就是的PR曲线越往坐标(1,1)的位置靠近越好。

如上图所示。
同时,这里包含的是I型错误(阳性分为阴性)和II型错误(阴性分为阳性)的权衡。
网友评论