ROC曲线的基本思想是把敏感度和特异性看作一个连续变化的过程,用一条曲线描述诊断系统的性能,其制作原理是在连续变量中不同界值点处计算相对应的灵敏度和特异度,然后以敏感度为纵坐标、1-特异性为横坐标绘制一条真阳性率与假阳性率的曲线。
ROC曲线首先是由二战中的电子工程师和雷达工程师发明的,用来侦测战场上的敌军载具,也就是信号检测理论,后面广泛应用于医学、无线电、生物学、犯罪心理学领域中,而且最近在机器学习和数据挖掘领域也得到了很好的发展。
准确度 accuracy=TP + TNTP + TN + FP + FN。我们的目标是求概率对,假设预测值为 0.8 的正样本有 10 个,那么低于 0.8 的负样本总数乘以 10 即为这一预测值的概率对,此外,我们还应该计算预测值等于 0.8 的负样本数,假设为 8,这种情况下,此时正负样本概率相等,需要取一半,即 8 * 10 / 2。