发布询价单
您的位置:首页 > 资讯 > 行业资讯 > 正文

人脸检测江湖的那些事儿——从旷视说起

2019-02-21 09:40 性质:转载 作者:Megvii旷视科技 来源:Megvii旷视科技
免责声明:AGV网(www.chinaagv.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
这是 Face++ Detection Team(R4D)第 3 篇知乎专栏。如果说该专栏的定位是双向交流,一个比较贴切的词可能是“窗口”:一方面,我们希望从论文的生产、研究员的成长乃至公司的文化氛围等多...

这是 Face++ Detection Team(R4D)第 3 篇知乎专栏。如果说该专栏的定位是双向交流,一个比较贴切的词可能是“窗口”:一方面,我们希望从论文的生产、研究员的成长乃至公司的文化氛围等多方面被了解,被认识,被熟悉,希望携手共同见证最优检测算法的研究、创新与落地,突破认知边界,实现降本增效,为客户和社会创造最大价值;另一方面,我们也希望了解读者的想法,增加与读者的互动,形成双向反馈的正向沟通机制。R4D 后续也会组织线下活动,加大加深彼此交流。如果你感兴趣,或者想加入,欢迎联系 Face++ Detection Team 负责人俞刚 (yugang@megvii.com)。

本次分享的主题是人脸检测(Face Detection),分享者是旷视科技王剑锋,来自 Face++ Detection 组。通过这篇文章,可以一窥旷视近两年在该方向的工作与思考,并希望为计算机视觉社区带来启发,进一步推动人脸检测技术的研究与落地。人脸检测是人脸识别的第一站,旷视的努力主要体现在紧紧围绕人脸检测领域顽固而核心的问题展开,攻坚克难,功夫花在刀刃上,比如人脸尺度的变动及遮挡等,实现速度与精度的双重涨点。

导语

人脸检测的目的是,给定任意图像,返回其中每张人脸的边界框(Bounding Box)坐标,实际操作上它对通用物体检测(General Object Detection)有较多借鉴,是通用物体检测技术的聚焦和细分。由于人脸检测是所有人脸分析算法的前置任务,诸如人脸对齐、人脸建模、人脸识别、人脸验证/认证、头部姿态跟踪、面部表情跟踪/识别、性别/年龄识别等等技术皆以人脸检测为先导,它的好坏直接影响着人脸分析的技术走向和落地,因而在学术界和工业界引起广泛的重视和投入。

如今,随着深度学习普及,人脸检测与通用物体检测已相差无几,作为二分类任务,其难度也低于通用物体检测,因此现阶段人脸检测研究更需走差异化路线,从实际应用中汲取营养。

尺度变化是人脸检测不同于通用物体检测的一大问题。通用物体的尺度变化范围一般在十几倍之内;与之相比,人脸的尺度变化范围由于摄像头不断升级,在 4K 甚至更高分辨率场景中可达数十倍甚至上百倍。面对这一问题,[1, 2] 给出的答案是寻找最优尺度多次采样原图,其本质是优化图像金字塔(Image Pyramid);[3, 4] 则利用不同深度的特征图适应不同尺度的人脸,其本质是优化特征金子塔(Feature Pyramid);而旷视自主研创的 SFace 方法试着从完全不同的角度切入这一问题。这是本文第一部分。

和尺度变化一样,遮挡也是人脸检测面临的常见挑战之一。实际场景中的眼镜、口罩、衣帽、头盔、首饰以及肢体等皆会遮挡人脸,拉低人脸检测的精度。对此,[5, 6] 尝试提升神经网络适应遮挡情况的能力,[7] 则将问题转化为遮挡与非遮挡人脸在向量空间中的距离这一度量学习问题。此外,很多深度学习方法训练时辅用的数据增强技术也在一定程度上提高了网络对遮挡情形的鲁棒性;而旷视原创的全新算法 FAN 也是针对人脸遮挡问题而提出。这是本文第二部分。

如上所述,人脸检测是人脸关键点、人脸识别等的前置任务,人脸检测框质量直接影响着整条 Pipeline 的表前,常见人脸检测数据集的评测指标对边界框质量缺乏关注;2018 WIDER Challenge  Face Detection 首次采用相同于MS COCO 的评测方式,表明这一状况已有大幅改善;本文第三部分则将介绍这次比赛夺冠的一些诀窍。

尺度变化: SFace


  • 论文名称:Face Attention Network: An Effective Face Detector for the Occluded Faces

  • 论文链接:https://arxiv.org/abs/1711.07246


目前的人脸检测方法仍无法很好地应对大范围尺度变述,基于图像金字塔的方法理论上可覆盖所有尺度,但必须多次采样原图,导致大量重复计算;而基于特征金字塔的方法,特征层数不宜加过多,从而限制了模型处理尺度范围的上限。是否存在一种方法,图像只通过模型一次,同时又覆盖到足够大的尺度范围呢?

目前,单步检测方法大致可分为两类:1)Anchor-based 方法,如 SSD[8]、RetinaNet[9] 等;2)Anchor-free 方法,如 DenseBox[10]、UnitBox[11]等。Anchor-based 方法处理的尺度范围虽小,但更精准;Anchor-free 方法覆盖的尺度范围较大,但检测微小尺度的能力低下。一个非常自然的想法就是,两种方法可以融合进一个模型吗?理想很丰满,现实很骨感,Anchor-based 和 Anchor-free 方法的输出在定位方式和置信度得分方面差异显著,直接合并两个输出困难很大,具体原因如下:

其一,对于 Anchor-based 方法,ground truth IoU ≥ 0.5 的锚点将被视为正训练样本。可以发现,正负样本的定义与边界框回归结果无关,这就导致 Anchor-based 分支每个锚点输出的分类置信度实质上表示的是“锚点框住的区域是人脸”的置信度,而不是“网络预测的回归框内是人脸”的置信度。故而分类置信度很难评估网络实际的定位精度。对于在业务层将 Classfication Subnet 和 Regression Subnet 分开的网络,情况将变得更为严重。

其二,对于 Anchor-free 方法,网络训练方式类似于目标分割任务。输出的特征图以边界框中心为圆心,半径与边界框尺度成比例的椭圆区域被定义为正样本区域,特征图其它位置(像素)被视为背景。通过这种方式,Anchor-free 分支的分类置信度得分实质为“该像素落在人脸上”的置信度,而且该分类置信度与定位的准确度的关联同样很弱。

总而言之,Anchor-based 方法和 Anchor-free 方法的分类置信度都与回归定位精度关联甚微,其置信度得分也分别代表着不同的含义。因此通过分类结果直接合并两个分支输出的边界框是不合理的,并且可能导致检测性能的急剧下降。


SFace网络结构


因此,可以将回归的边界框和 groundtruth 边界框之间的 IoU 当作 Classfication Subnet 的 groundtruth,这正是 SFace 所做的事情。


具体而言,SFace 设计了Anchor-based 和 Anchor-free 两个分支,前者基于RetinaNet,后者基于 UnitBox;两个分支都在训练第一步通过 Regression Subnet 生成边界框;接着计算边界框和 groundtruth 边界框之间的 IoU;(Anchor-based 分支的)锚点和(Anchor-free 分支的)像素中 IoU≥0.5 的结果将视为Classfication Subnet 的正样本,其它则视为负样本,Classfication Loss 采用 Focal Loss。我们还尝试过直接回归 IoU,然而实验结果表明,相较于采用 Sigmoid Cross Entropy 或 Focal Loss,直接回归 IoU 所得结果方差较大,实际效果欠佳。


Anchor-based 分支和 Anchor-free 分支都使用 IoU Loss 做为 Regression Loss。这种调整有助于统一两个分支的输出方式,优化组合结果。通过以上修正,两个分支的分类子网络的实质含义得到统一,分类置信度的分布得到一定程度的弥合,从而 SFace 可有效融合两个分支的结果。


此外,SFace 必须运行很快才有实际意义,否则大可以选择做图像金字塔。为此,基于Xception,SFace 采用了一个 FLOPs 仅有 39M 的 Backbone,称之为 Xception-39M,每个 Block 包括 3 个 SeparableConv 的 Residual Block。Xception-39M 运算量非常小,感受野却高达 1600+,十分适合处理更高分辨率图像。


Xception-39M 网络结构


Xception-39M 单一 Block 结构


SFace Backbone 理论计算量只有下表中部分方法的 1/200,这些方法多采用 VGG-16、ResNet-101 等作为 Backbone),且都采用多尺度测试;而 SFace测试全部在单一尺度下进行。事实上,SFace 的设计初衷正是只在一个尺度下测试即可覆盖更大范围的尺度变化。


WIDER Face 验证集和测试集的 PR 曲线


消融实验证明直接融合 Anchor-based 与 Anchor-free 方法不可行,而 SFace提出的融合方法是有效的。Anchor-free 分支覆盖了绝大多数尺度(easy set和 medium set),而 Anchor-based 分支提升了微小人脸(hard set)的检测能力。


WIDER Face 验证集的消融实验


4K 分辨率下,SFace 运行速度上接近实时,据知这在深度学习人脸检测领域是第一个,也是首个在 4K 分辨率下 WIDER Face hard AP 高于 75 的实时人脸检测方法。


SFace 在不同分辨率下的运行时间(单张NVIDIA Titan Xp)


遮挡:FAN


  • 论文名称:Face Attention Network: An Effective Face Detector for the Occluded Faces

  • 论文链接:https://arxiv.org/abs/1711.07246

我们可以从另一个角度考虑遮挡问题。一个物体在清晰可见、无遮挡之时,其特征图对应区域的响应值较高;如果物体有(部分)遮挡,理想情况应是只有遮挡区域响应值下降,其余部分不受影响;但实际情况却是整个物体所在区域的响应值都会降低,进而导致模型 Recall 下降。

上一页12

网友评论
文明上网,理性发言,拒绝广告

相关资讯

  • 车间新来了两个“AI智能工友”
    “智能AI叉车机器人可在无人值守的状态下完成上下货工作。”近日,在物资装备公司配件仓库,一场别开生面的“智能仓储 AI助力”双创发布会正在火热进行中。随着物资装备公司杨帆劳模创新工作室负...

    2025-06-03 18:34

  • 文昌电厂:打造智能仓库 让仓储管理提“智”增效
    4月,经过星级仓库现场评定,海南分公司文昌电厂仓库被集团公司评定为“五星级仓库”。走进这座“五星级仓库”,WMS智能仓库管理系统正化身“指挥官”调度着“智能仓储员工”们有条不紊地进行着物...

    2025-06-03 18:33

  • 中国AGV网本周热点回顾(2025年5月26日-5月31日)
    AGV网(www.chinaagv.com)是中国自动导航机器人(AGV)和自主移动机器人(AMR)行业网站!团队拥有超过23年的行业垂直门户运营经验,多年来见证了传统内部物料搬运从粗放化、低效率沿着更加智能化、...

    2025-06-03 18:30

  • 上海“智”造先锋:AI重构工业新范式下的柔性生产
    在上海长宁区的黑湖科技展厅里,一块实时刷新的电子屏上跳动着数万家工厂的生产数据——某食品企业的饺子皮切割模具利用率因AI工艺优化提升23倍,某新能源车企的订单响应时长通过智能排产缩短至原...

    2025-05-28 21:29

  • 强省会 拼经济 | “贵安造”机器人实现全线投产
    近日,贵安新区威迈尔科技有限公司四条智能产线全线投产。作为智能制造领域的新锐企业,该公司从首台机器人下线到全线投产仅用时三个月,跑出了产业发展"加速度"。走进贵安新区威迈尔科技有限公司...

    2025-05-28 21:24

  • 南京市创新产品巡展——智能制造装备、轨道交通产业类32|电力行业室内智能操作机器人
    1. 公司简介亿嘉和科技股份有限公司在2018年6月在上海证券交易所A股主板上市(股票代码603666),公司践行“应用智能科技 改善人类生活”的企业使命,聚合全球创新,以特种机器人研发为切入点,...

    2025-05-28 21:20

  • 中国AGV网本周热点回顾(2025年5月19日-5月24日)
    AGV网(www.chinaagv.com)是中国自动导航机器人(AGV)和自主移动机器人(AMR)行业网站!团队拥有超过23年的行业垂直门户运营经验,多年来见证了传统内部物料搬运从粗放化、低效率沿着更加智能化、...

    2025-05-26 18:37

  • 中国自动化码头效率再次刷新世界纪录
    5月22日,历时10小时35分钟,随着“凯普圣拉萨罗”轮最后一个集装箱完成装卸作业,山东港口青岛港自动化码头以桥吊平均单机作业效率62.62自然箱/小时的优异成绩,第十三次刷新全球自动化集装箱码头...

    2025-05-26 18:35

  • 数智工厂×智慧物流:LET 2025物流展今日正式开幕
    中国AGV网(www.chinaagv.com/)新闻中心2025年5月21日,备受业界瞩目的中国(广州)国际物流装备与技术展览会(LET 2025)在广州·中国进出口商品交易会展馆D区盛大启幕!作为华南地区规模最大、...

    2025-05-22 13:30

  • 国内单一码头最大IGV车队集结!
    近日由上海振华重工集团设计制造的广州南沙四期全自动化码头第四批20台无人驾驶智能导引车(IGV)全部抵港至此广州南沙四期全自动化码头IGV车队扩员至158台标志着国内单一码头最大的IGV车队系统全...

    2025-05-19 17:48

关注官方微信

手机扫码看新闻