上面示意图中出现了错误标注。而在完美注释的数据集中,以上两个错误均不存在。因此,定义质量的一种方法是计算这些错误在带注释的数据集中出现的程度。例如计算
实际表示对象的包围盒的比率。这称为精度。理想情况下,精度为1。
用边界框正确注释的对象的比率。这就是所谓的召回。理想情况下,召回率为1。
但是,计算数据集的精度和召回率还需要对整个数据集中的每个帧进行人工批判性检查,这可能与注释过程本身一样昂贵!为了在计算精度和召回率时获得效率,因此Annotell团队依靠统计数据来推断精度和召回率。仅对所有注释的统计选择良好的子集进行人工批判性审查,并使用概率论得出有关整个数据集的结论。更详细地讲,他们使用贝叶斯方法来计算后验分布,以提高精度并召回整个数据集,这取决于已经进行了严格审查的注释的子样本。它不仅提供了精确度和召回率的估计,而且还量化了这些估计中的不确定性。例如,我们可以计算所谓的95%可信度下限,这意味着可以确定95%的精度或召回率不低于此阈值。Annotell公司提供了一种具有成本效益的工具,用于根据精度和召回级别以及对级别的确定性来衡量注释的质量。
2025-03-26 11:46
2025-03-26 11:45
2025-03-25 08:58
2025-03-24 11:41
2025-03-20 13:44
2025-03-17 12:35
2025-03-12 17:36
2025-03-12 16:56
2025-03-07 14:59
2025-03-05 15:37