【机器学习笔记】准确率、召回率、F值的计算方法-准确率 召回率 roc

2023-08-18 13:01:02

 

1 二分类问题

假设有一个二分类器,只能输出True或False,那么对一个二元变量进行预测,有四种结果:

y_true=True, y_pred=True: TP (True Positive)y_true=True, y_pred=False: FN (False Negative)y_true=False, y_pred=True: FP (False Positive)y_true=False, y_pred=False: TN (True Negative)

简单来说,T/F表示预测是否正确,P/N表示预测的值。

1.1 准确率(Accuracy)

准确率表示预测正确的数量占总数的比例:

Accuracy=TP+TNTP+TN+FP+FN\rm Accuracy = \frac{TP + TN}{TP + TN + FP + FN}\\

1.2 精度(Precision)

精度表示在预测为真的结果中,确实为真的比例:

Precision=TPTP+FP\rm Precision = \frac{TP}{TP+FP} \\

1.3 召回率(Recall)

召回率表示在所有真实为真的数据中,预测也为真的比例:Recall=TPTP+FN\rm Recall = \frac{TP}{TP+FN}\\

1.4 F值(F-measure)

F值定义为精度与召回率的调和平均:

F-measure=21P+1R\rm F\mbox{-}measure = \frac{2}{\frac{1}{P} + \frac{1}{R}} \\

2 多分类多标签问题

在多分类多标签问题中,F值的计算分为F1-micro和F1-macro。计算方法为对每一个类别计算F值,然后用不同的均值方法来聚合。

考虑以下多分类多标签案例,其中每一行表示一个样本,每个样本分为4类:

预测值: [[1 1 1 1] [1 1 1 1] [1 0 0 0] [1 0 0 1] [1 1 0 0]] 真实值: [[0 1 0 0] [1 1 1 0] [1 1 0 1] [0 0 0 0] [1 1 0 1]]

然后计算总体的F值,以及按每个类别计算F值:

2.2 F1-micro

F1-micro的值为总体计算得到的F值,即上图中的0.6086。它考虑了不同类别之间数量的不均衡性。

2.3 F1-macro

F1-macro的值为按每一类计算出的F值,取平均值得到,即上图中的0.5684。它没有考虑到不同类别之间数量的不均衡性。

2.4 多分类单标签问题的特殊性质

容易证明,在多分类单标签问题中,F1-micro值与Accuracy的值是相等的。


以上就是关于《【机器学习笔记】准确率、召回率、F值的计算方法-准确率 召回率 roc》的全部内容,本文网址:https://www.7ca.cn/baike/68737.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜