从曲线上看,真实 AP< approximated AP < Interpolated AP,11-points Interpolated AP 可能大也可能小,当数据量很多的时候会接近于 Interpolated AP,与 Interpolated AP 不同,前面的公式中计算 AP 时都是对 PR 曲线的面积估计,PASCAL 的论文里给出的公式就更加简单粗暴了,直接计算11 个阈值处的 precision 的平均值。
本研究通过对百万级多域通用目标检测问题的研究,推动了研究方向的发展,由于跨数据集类别标签复制、标签冲突和层次分类法处理的复杂性,这个问题并非微不足道,此外,利用新兴的大型预训练视觉模型进行百万级跨数据集对象检测的资源效率方法仍然是一个开放的挑战。
目标识别方法一直是近年来计算机视觉领域的研究热点。目前有两种用于目标检测的先进深度学习方法:基于R-CNN的目标检测算法,该算法首先生成候选区域,然后执行分类或回归,以及You Only Look Once和Single Shot MultiBox Detector算法,仅使用一个 CNN 执行分类或回归。
当输入大小为 320 时,它在移动 ARM CPU 上达到 123 FPS。从该目标检测项目来看,特别是在没有GPU环境,迭代5次,训练时间约20多分钟,准确率能达85%以上,而且模型大小不足20MB,所以说PP-PicoDet总体表现还是非常优秀的。