您的位置：首页 > 资讯 > 行业资讯 > 正文

人脸检测江湖的那些事儿——从旷视说起

2019-02-21 09:40 性质：转载作者：Megvii旷视科技来源：Megvii旷视科技

免责声明：AGV网（www.chinaagv.com)尊重合法版权，反对侵权盗版。（凡是我网所转载之文章，文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点，与本网无关。如有需要删除，敬请来电商榷！）

这是 Face++ Detection Team（R4D）第 3 篇知乎专栏。如果说该专栏的定位是双向交流，一个比较贴切的词可能是“窗口”：一方面，我们希望从论文的生产、研究员的成长乃至公司的文化氛围等多...

这是 Face++ Detection Team（R4D）第 3 篇知乎专栏。如果说该专栏的定位是双向交流，一个比较贴切的词可能是“窗口”：一方面，我们希望从论文的生产、研究员的成长乃至公司的文化氛围等多方面被了解，被认识，被熟悉，希望携手共同见证最优检测算法的研究、创新与落地，突破认知边界，实现降本增效，为客户和社会创造最大价值；另一方面，我们也希望了解读者的想法，增加与读者的互动，形成双向反馈的正向沟通机制。R4D 后续也会组织线下活动，加大加深彼此交流。如果你感兴趣，或者想加入，欢迎联系 Face++ Detection Team 负责人俞刚（yugang@megvii.com）。

本次分享的主题是人脸检测（Face Detection），分享者是旷视科技王剑锋，来自 Face++ Detection 组。通过这篇文章，可以一窥旷视近两年在该方向的工作与思考，并希望为计算机视觉社区带来启发，进一步推动人脸检测技术的研究与落地。人脸检测是人脸识别的第一站，旷视的努力主要体现在紧紧围绕人脸检测领域顽固而核心的问题展开，攻坚克难，功夫花在刀刃上，比如人脸尺度的变动及遮挡等，实现速度与精度的双重涨点。

导语

人脸检测的目的是，给定任意图像，返回其中每张人脸的边界框（Bounding Box）坐标，实际操作上它对通用物体检测（General Object Detection）有较多借鉴，是通用物体检测技术的聚焦和细分。由于人脸检测是所有人脸分析算法的前置任务，诸如人脸对齐、人脸建模、人脸识别、人脸验证/认证、头部姿态跟踪、面部表情跟踪/识别、性别/年龄识别等等技术皆以人脸检测为先导，它的好坏直接影响着人脸分析的技术走向和落地，因而在学术界和工业界引起广泛的重视和投入。

如今，随着深度学习普及，人脸检测与通用物体检测已相差无几，作为二分类任务，其难度也低于通用物体检测，因此现阶段人脸检测研究更需走差异化路线，从实际应用中汲取营养。

尺度变化是人脸检测不同于通用物体检测的一大问题。通用物体的尺度变化范围一般在十几倍之内；与之相比，人脸的尺度变化范围由于摄像头不断升级，在 4K 甚至更高分辨率场景中可达数十倍甚至上百倍。面对这一问题，[1, 2] 给出的答案是寻找最优尺度多次采样原图，其本质是优化图像金字塔（Image Pyramid）；[3, 4] 则利用不同深度的特征图适应不同尺度的人脸，其本质是优化特征金子塔（Feature Pyramid）；而旷视自主研创的 SFace 方法试着从完全不同的角度切入这一问题。这是本文第一部分。

和尺度变化一样，遮挡也是人脸检测面临的常见挑战之一。实际场景中的眼镜、口罩、衣帽、头盔、首饰以及肢体等皆会遮挡人脸，拉低人脸检测的精度。对此，[5, 6] 尝试提升神经网络适应遮挡情况的能力，[7] 则将问题转化为遮挡与非遮挡人脸在向量空间中的距离这一度量学习问题。此外，很多深度学习方法训练时辅用的数据增强技术也在一定程度上提高了网络对遮挡情形的鲁棒性；而旷视原创的全新算法 FAN 也是针对人脸遮挡问题而提出。这是本文第二部分。

如上所述，人脸检测是人脸关键点、人脸识别等的前置任务，人脸检测框质量直接影响着整条 Pipeline 的表前，常见人脸检测数据集的评测指标对边界框质量缺乏关注；2018 WIDER Challenge Face Detection 首次采用相同于MS COCO 的评测方式，表明这一状况已有大幅改善；本文第三部分则将介绍这次比赛夺冠的一些诀窍。

尺度变化： SFace

论文名称：Face Attention Network: An Effective Face Detector for the Occluded Faces
论文链接：https://arxiv.org/abs/1711.07246

目前的人脸检测方法仍无法很好地应对大范围尺度变述，基于图像金字塔的方法理论上可覆盖所有尺度，但必须多次采样原图，导致大量重复计算；而基于特征金字塔的方法，特征层数不宜加过多，从而限制了模型处理尺度范围的上限。是否存在一种方法，图像只通过模型一次，同时又覆盖到足够大的尺度范围呢？

目前，单步检测方法大致可分为两类：1）Anchor-based 方法，如 SSD[8]、RetinaNet[9] 等；2）Anchor-free 方法，如 DenseBox[10]、UnitBox[11]等。Anchor-based 方法处理的尺度范围虽小，但更精准；Anchor-free 方法覆盖的尺度范围较大，但检测微小尺度的能力低下。一个非常自然的想法就是，两种方法可以融合进一个模型吗？理想很丰满，现实很骨感，Anchor-based 和 Anchor-free 方法的输出在定位方式和置信度得分方面差异显著，直接合并两个输出困难很大，具体原因如下：

其一，对于 Anchor-based 方法，ground truth IoU ≥ 0.5 的锚点将被视为正训练样本。可以发现，正负样本的定义与边界框回归结果无关，这就导致 Anchor-based 分支每个锚点输出的分类置信度实质上表示的是“锚点框住的区域是人脸”的置信度，而不是“网络预测的回归框内是人脸”的置信度。故而分类置信度很难评估网络实际的定位精度。对于在业务层将 Classfication Subnet 和 Regression Subnet 分开的网络，情况将变得更为严重。

其二，对于 Anchor-free 方法，网络训练方式类似于目标分割任务。输出的特征图以边界框中心为圆心，半径与边界框尺度成比例的椭圆区域被定义为正样本区域，特征图其它位置（像素）被视为背景。通过这种方式，Anchor-free 分支的分类置信度得分实质为“该像素落在人脸上”的置信度，而且该分类置信度与定位的准确度的关联同样很弱。

总而言之，Anchor-based 方法和 Anchor-free 方法的分类置信度都与回归定位精度关联甚微，其置信度得分也分别代表着不同的含义。因此通过分类结果直接合并两个分支输出的边界框是不合理的，并且可能导致检测性能的急剧下降。

SFace网络结构

因此，可以将回归的边界框和 groundtruth 边界框之间的 IoU 当作 Classfication Subnet 的 groundtruth，这正是 SFace 所做的事情。

具体而言，SFace 设计了Anchor-based 和 Anchor-free 两个分支，前者基于RetinaNet，后者基于 UnitBox；两个分支都在训练第一步通过 Regression Subnet 生成边界框；接着计算边界框和 groundtruth 边界框之间的 IoU；（Anchor-based 分支的）锚点和（Anchor-free 分支的）像素中 IoU≥0.5 的结果将视为Classfication Subnet 的正样本，其它则视为负样本，Classfication Loss 采用 Focal Loss。我们还尝试过直接回归 IoU，然而实验结果表明，相较于采用 Sigmoid Cross Entropy 或 Focal Loss，直接回归 IoU 所得结果方差较大，实际效果欠佳。

Anchor-based 分支和 Anchor-free 分支都使用 IoU Loss 做为 Regression Loss。这种调整有助于统一两个分支的输出方式，优化组合结果。通过以上修正，两个分支的分类子网络的实质含义得到统一，分类置信度的分布得到一定程度的弥合，从而 SFace 可有效融合两个分支的结果。

此外，SFace 必须运行很快才有实际意义，否则大可以选择做图像金字塔。为此，基于Xception，SFace 采用了一个 FLOPs 仅有 39M 的 Backbone，称之为 Xception-39M，每个 Block 包括 3 个 SeparableConv 的 Residual Block。Xception-39M 运算量非常小，感受野却高达 1600+，十分适合处理更高分辨率图像。

Xception-39M 网络结构

Xception-39M 单一 Block 结构

SFace Backbone 理论计算量只有下表中部分方法的 1/200，这些方法多采用 VGG-16、ResNet-101 等作为 Backbone），且都采用多尺度测试；而 SFace测试全部在单一尺度下进行。事实上，SFace 的设计初衷正是只在一个尺度下测试即可覆盖更大范围的尺度变化。

WIDER Face 验证集和测试集的 PR 曲线

消融实验证明直接融合 Anchor-based 与 Anchor-free 方法不可行，而 SFace提出的融合方法是有效的。Anchor-free 分支覆盖了绝大多数尺度（easy set和 medium set），而 Anchor-based 分支提升了微小人脸（hard set）的检测能力。

WIDER Face 验证集的消融实验

4K 分辨率下，SFace 运行速度上接近实时，据知这在深度学习人脸检测领域是第一个，也是首个在 4K 分辨率下 WIDER Face hard AP 高于 75 的实时人脸检测方法。

SFace 在不同分辨率下的运行时间（单张NVIDIA Titan Xp）

遮挡：FAN

论文名称：Face Attention Network: An Effective Face Detector for the Occluded Faces

论文链接：https://arxiv.org/abs/1711.07246

我们可以从另一个角度考虑遮挡问题。一个物体在清晰可见、无遮挡之时，其特征图对应区域的响应值较高；如果物体有（部分）遮挡，理想情况应是只有遮挡区域响应值下降，其余部分不受影响；但实际情况却是整个物体所在区域的响应值都会降低，进而导致模型 Recall 下降。

0赞 0踩

下一篇 LogiMAT展的三大最佳产品奖

上一篇 4.0 NOW Factory 闪亮登场，体验智能与创新——SICK全球媒体发布会

网友评论
文明上网，理性发言，拒绝广告
0条评论

相关资讯
更多>>

中国AGV网本周热点回顾（2024年3月25日-3月30日)

AGV网(www.chinaagv.com)是中国自动导航机器人(AGV)和自主移动机器人(AMR)行业网站!团队拥有超过23年的行业垂直门户运营经验，多年来见证了传统内部物料搬运从粗放化、低效率沿着更加智能化、自主...

2024-04-01 09:19
进击的“无人工厂”，智能制造大显身手！

习近平总书记在参加十四届全国人大二次会议江苏代表团审议时强调，要牢牢把握高质量发展这个首要任务，因地制宜发展新质生产力。即日起，张家港市融媒体中心（传媒集团）开设专栏“强信心·勇突破...

2024-03-26 09:12
中国AGV网本周热点回顾（2024年3月18日-3月23日)

AGV网(www.chinaagv.com)是中国自动导航机器人(AGV)和自主移动机器人(AMR)行业网站!团队拥有超过23年的行业垂直门户运营经验，多年来见证了传统内部物料搬运从粗放化、低效率沿着更加智能化、自主...

2024-03-25 09:20
引入AGV无人搬运叉车前应该进行的有效沟通

agv随着科技的快速发展，无人化、智能化成为物流行业发展的新趋势。其中，AGV无人搬运车以其高效、准确、灵活的特点，逐渐成为物流行业的超能英雄。AGV小车小车又叫无人搬运车，自动导引车，移动搬...

2024-03-25 09:07
"可持续、人工智能和人体工程学"--中国叉车和移动机器人军团亮相Logimat 2024德国斯图展

中国叉车网(www.chinaforklift.com)、AGV网(www.chinaagv.com)新闻中心3月19日(德国当地时间)上午9点，一年一度的国际内部物流展会-Logimat 2024在德国斯图加特准时开幕。在12万5000平方米（10个...

2024-03-20 11:40
加“数”提质——从“解放双手”到“聪明大脑”

偌大的洁净车间里，最忙碌的“工人”当属穿梭不停的AGV（智能搬运机器人）小车：从原材料供送到成品电池片搬运，500多米长的智能化生产线、十几道工序，搬运工作全部由它们负责。图为AGV（智能搬运...

2024-03-20 09:37
中国AGV网本周热点回顾（2024年3月11日-3月16日)

AGV网(www.chinaagv.com)是中国自动导航机器人(AGV)和自主移动机器人(AMR)行业网站!团队拥有超过23年的行业垂直门户运营经验，多年来见证了传统内部物料搬运从粗放化、低效率沿着更加智能化、自主...

2024-03-18 09:43
MODEX 2024 | AGV & AMR新品亮相

由美国物料搬运协会（MHI）主办的、两年一度的Modex 2024于当地时间3月11日在美国佐治亚州首府亚特兰大Georgia World Congress Center（佐治亚世界大会中心）开幕。Modex又被称为美国亚特兰大...

2024-03-18 09:39
动态风采：中国移动机器人军团闪耀亚特兰大MODEX 2024（一）

Modex每年都在不断壮大，2024年也不例外。展会将于2024年3月11日至14日在亚特兰大乔治亚世界会议中心(GWCC)展出超过1,100件展品，占地超过570,000净平方英尺。MODEX是一个每两年举办一次的物流和供...

2024-03-12 10:29
Modex 2024展现了机器人技术与供应链管理融合的新兴趋势

Modex 2024于3月11日在美国亚特兰大的Georgia World Congress Center开幕，将一直持续到14日。这是北美最大的国际供应链博览会，汇集了1200多个展商，展示了制造、供应链和运输操作的全方位设...

2024-03-12 09:33