[图像检索]Recall@K

关于图像检索任务的Recall@K计算,存在多种解释,汇总一下

问题

经常在论文中发现使用Recall@K作为评估指标,可以查看

按照之前学习的关于信息检索的评估指标:[图像检索]准确率、查准率/精确度、查全率/召回率、AP/mAPRecall的计算应该是查询图像对应标签在检索标签列表的前topK位中出现的次数与真值标签列表个数的比例。从这个角度来看,Recall@1的计算应该是有上限的,因为真值标签列表的个数是固定的。

不过从具体论文上来看,Recall@1的结果越来越大,不符合上述定义?

解析

查询了一些文章,发现度量学习(metric learning)任务中Recall的计算与信息检索(information retrieval)任务中关于Recall的定义并不相同:

  1. Recall(metric learning):前topK位检索标签列表中是否出现了真值标签,是就是1, 否则就是0
  2. Recall(information retrieval):查询图像对应标签在检索标签列表的前topK位中出现的次数与真值标签列表个数的比例。

基于上述的定义,可以发现度量学习任务中的Recall计算更类似于目标分类任务中的准确率计算,这也就解释了上述这些数据集任务为什么可以使用Recall@1作为评估指标。

相关阅读