首页 > 技术文章 > 性能指标

fariver 2017-04-06 20:01 原文

对于二分类问题

混淆矩阵####

TP(真正例):将正类预测为正类
FN(假反例):将正类预测为负类
FP(假正例): 将负类预测为正类
TN(真反例): 将负类预测为负类
这么看,可能有点头晕,换个角度:

  • 第一个字母(T or F):表示预测值与真实值是否一致,一致的话为T,否则为F
  • 第二个字母(P or N):表示预测值为正(T)或者负(P)

三个常用指标

  • 查准率:

\[P = \frac{TP}{TP+FP} \]

即在所有预测为正的样本里面真实值为正样本所占的比例

  • 召回率:

\[R=\frac{TP}{TP+FN} \]

FN样本的真实标签其实为正,故分母为所有真实值为正的样本数, 即该公式表示:
所有真实值为正的样本中预测值也为正的样本数

  • F1值

\[F_{1}=\frac{2}{\frac{1}{P}+\frac{1}{R}} \]

P与R的调和均值,综合衡量的查准率与召回率

mAP####

目标检测中衡量识别精度的指标是mAP(mean average precision)。多个类别物体检测中,每一个类别都可以根据recall和precision绘制一条P-R曲线,AP就是该曲线下的面积,mAP是多个类别AP的平均值。
而P-R曲线是如何绘制的呢?
检测器输出每个检测结果都会对应一个detect confidence,我们会人为设定一个confidence阈值,如果检测结果高于confidence阈值,那预测该检测为正样本,否则为预测为负。
显然,阈值设置越高,则查准率P越高,但相应召回率R就越底,我们可以通过设置不同的阈值得到P-R曲线。

[ref] (http://blog.csdn.net/a1154761720/article/details/50864994)

推荐阅读