精确率和召回率-精确率召回率 f值

2023-08-18 13:47:28

 

精确率和召回率都是二分类算法的评价指标。刚开始接触时,我们会很容易混淆精确率和召回率的概念。下面为大家区分一下这两个的概念

1.解释混淆矩阵

要解释清楚精确率和召回率,得先解释混淆矩阵,二分类问题的混淆矩阵由 4 个数构成。

假阴性(FN): 算法预测为负例(N),实际上是正例(P)的个数,即算法预测错了(False);

真阴性(TN):算法预测为负例(N),实际上也是负例(N)的个数,即算法预测对了(True);

真阳性(TP):算法预测为正例(P),实际上是负例(N)的个数,即算法预测错了(False);

假阳性(FP):算法预测为正例(P),实际上也是正例(P)的个数,即算法预测对了(True)。

混淆矩阵定义如下:

2.精确率(precision)的定义:

精确率: precision=TPTP+FPprecision =\frac{TP}{TP+FP}

所以,精准率就是“预测为正例的那些数据里预测正确的数据个数”。

3.召回率(recall)的定义:

召回率: recall=TPTP+FNrecall =\frac{TP}{TP+FN}

所以,召回率就是“真实为正例的那些数据里预测正确的数据个数”。

借助图形加深印象:

4.调和均值

精准率和召回率是此消彼长的,即精准率高了,召回率就下降,在一些场景下要兼顾精准率和召回率,就有 F1 score。

F1值是来综合评估精确率和召回率,当精确率和召回率都高时,F1也会高

F1的公式为: 2F1=1P+1R\frac{2}{F_{1}}=\frac{1}{P}+\frac{1}{R}

有时候我们对精确率和召回率并不是一视同仁,我们用一个参数 β\beta 来度量两者之间的关系。

()Fβ=(1+β2∗P∗R)β2∗P+RF_{\beta}=\frac{(1+\beta^{2}*P*R)}{\beta^{2}*P+R}

如果 β\beta >1,召回率有更大的影响;

如果 β\beta <1,精确率有更大的影响;

如果 β\beta =1,精确率和召回率影响力相同,和 F1F_{1} 形式一样;

5.灵敏度和特异度

灵敏度(真阳率,召回率),识别的正例占所有实际正例的比例

公式: TPR=TPTP+FNTPR = \frac{TP}{TP+FN}

特异度(假阳率),识别的假阳例占所有实际负例的比例

公式: TPR=TPTP+FNTPR = \frac{TP}{TP+FN}

看图像加深理解:

(a)假阳率比较低的情况下真阳率比较高则比较好 ROC曲线的横坐标是FPR特异度,y坐标为灵敏度

(b)算法2比较好 PR曲线的横坐标为召回率,纵坐标为精确率


以上就是关于《精确率和召回率-精确率召回率 f值》的全部内容,本文网址:https://www.7ca.cn/baike/68747.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜