(12)发明专利申请
(10)申请公布号 CN 107273864 A(43)申请公布日 2017.10.20
(21)申请号 201710482502.6(22)申请日 2017.06.22
(71)申请人 星际(重庆)智能装备技术研究院有
限公司
地址 400030 重庆市沙坪坝区汇泉路1号附
13号附4号(72)发明人 宋永端 刘永 杨琳 赖俊峰
李攀飞 张子涛 张云福 (74)专利代理机构 重庆信航知识产权代理有限
公司 50218
代理人 吴彬(51)Int.Cl.
G06K 9/00(2006.01)G06K 9/62(2006.01)G06N 3/08(2006.01)
权利要求书1页 说明书3页 附图2页
(54)发明名称
一种基于深度学习的人脸检测方法(57)摘要
本发明公开了一种基于深度学习的人脸检测方法,包括步骤:步骤一、对采集的人脸图像进行人脸对齐;步骤二、对经步骤一处理过的人脸图像,通过深度卷积神经网络进行人脸特征的提取;步骤三、将步骤二中输出的特征向量进行归一化处理,然后再与系统中原本存储的特征向量进行余弦相似度计算,最后进行阈值比较,得出人脸检测结果。本发明基于深度学习的人脸检测方法,其具有人脸图像特征提取速度快、准确度高、鲁棒性良好、网络结构简单等优点。
CN 107273864 ACN 107273864 A
权 利 要 求 书
1/1页
1.一种基于深度学习的人脸检测方法,其特征在于:包括以下步骤:步骤一、对采集的人脸图像进行人脸对齐;步骤二、对经步骤一处理过的人脸图像,通过深度卷积神经网络进行人脸特征的提取;进行人脸图像特征提取的网络结构:包含了6个卷积层和2个全连接层,每个卷积层有2个3*3的卷积核,并且将残差网络结构引入卷积神网络,形成命名为稀疏残差网络的网络结构,稀疏残差网络的网络结构的表示形式如下:
ynl=y0l+y1l+y2l+...+yn-1l+fn(yn-1l)其中y0l作为上一残差模块的输出,即第l-1残差模块的输出,同时作为第l模块的输入,y1l,y2l,y3l…fn(yn-1l)作为第l模块中的卷积层输出特征图,ynl作为第l模块的最终输出;
步骤三、将步骤二中输出的特征向量进行归一化处理,然后再与系统中原本存储的特征向量进行余弦相似度计算,最后进行阈值比较,得出人脸检测结果。
2
CN 107273864 A
说 明 书
一种基于深度学习的人脸检测方法
1/3页
技术领域
[0001]本发明涉及人脸识别技术领域,特别涉及一种适用于多个任务的人脸特征识别方法。
背景技术
[0002]人脸识别方法的一般流程如下:系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸图象,而其输出则是一系列相似度得分,表明待识别的人脸的身份。人脸识别方法主要包括特征提取,特征匹配,相似度计算这三个部分。不同计算得到的相似度需要与预想设定的门槛阈值进行比较,当相似度等于或者高于该阈值时,判定人脸身份。因此,人脸识别算法中的特征提取算法的好坏直接影响到后面的特征匹配和相似度计算的准确性,对识别效果准确性有着至关重要的作用。目前,国内外对于人脸特征提取算法的应用主要集中于以下三点:[0003]1)特征脸方法:寻找人脸图像分布的基本元素,也就是人脸图像样本集协方差的特征向量,以这个向量近似表示人脸图像。此向量就是这个人脸的特征向量或者叫做特征脸。
[0004]2)弹性图匹配方法:将人脸特征的某些点作为基准点,以此构成了弹性图,每个基准点储存了一系列代表性的特征矢量,以此作为人脸的提取特征。[0005]3)神经网络方法:人工神经网络是一种非线性的动力学系统,具有很好的自组织,自适应性。大部分优秀的特征提取器都是使用卷积神经网络。有多层的卷积层和全连接层构成,人脸图像输入之后,经过卷积层提取多个特征图,然后由全连接层输出特征向量,以此构成人脸的提取特征。[0006]其中,特征脸方法具有简单,快速,实用性的优点,但由于它在实际应用的时候过于依赖于训练样本集和测试样本集的图像灰度相关性,并且需要测试样本跟训练样本比较接近,所以有很大的局限性,不能在实际中广泛应用。弹性图匹配方法具有良好的识别精度,适用性也不错,但是缺点也很明显:时间复杂度高,识别速度慢,实现起来比较复杂。发明内容
[0007]有鉴于此,针对现有人脸特征提取方法存在不足,本发明的目的是提供一种具有提取速度快、准确度高、良好的鲁棒性、网络结构简单等优点的基于深度学习的人脸检测方法。
[0008]本发明基于深度学习的人脸检测方法,包括以下步骤:[0009]步骤一、对采集的人脸图像进行人脸对对齐;[0010]步骤二、对经步骤一处理过的人脸图像,通过深度卷积神经网络进行人脸特征的提取;
[0011]进行人脸图像特征提取的网络结构:包含了6个卷积层和2个全连接层,每个卷积层有2个3*3的卷积核,并且将残差网络结构引入卷积神网络,形成命名为稀疏残差网络的
3
CN 107273864 A
说 明 书
2/3页
网络结构,稀疏残差网络的网络结构的表示形式如下:[0012]ynl=y0l+y1l+y2l+...+yn-1l+fn(yn-1l)[0013]其中y0l作为上一残差模块的输出,即第l-1残差模块的输出,同时作为第l模块的输入,y1l,y2l,y3l…fn(yn-1l)作为第l模块中的卷积层输出特征图,ynl作为第l模块的最终输出;
[0014]步骤三、将步骤二中输出的特征向量进行归一化处理,然后再与系统中原本存储的特征向量进行余弦相似度计算,最后进行阈值比较,得出人脸检测结果。[0015]本发明的有益效果:
[0016]本发明基于深度学习的人脸检测方法,其具有人脸图像特征提取速度快、准确度高、鲁棒性良好、网络结构简单等优点。附图说明
[0017]图1为人脸对齐矫正示意图;
[0018]图2为卷积神经网络特征提取器的网络结构;[0019]图3为SRN残差模块结构;
[0020]图4为SRN残差模块结构展开图。
具体实施方式
[0021]下面结合附图和实施例对本发明作进一步描述。[0022]本实施例基于深度学习的人脸检测方法,包括以下三个步骤:[0023]步骤一、对采集的人脸图像进行人脸对对齐;人脸对齐是人脸识别的前端处理,通过对人脸图像进行缩放,旋转,切割等操作,使所有人脸图像依照某种标准规范化。通过人脸对齐纠正人脸在采集过程中出现的大差异姿态,夸张表情等不利于识别的因素。在本具体实施例中,采用现有的CFAN人脸对齐算法进行人脸对齐,该方法是一种由粗到精的自编码器网络,求解复杂的非线性映射过程。如图1,CFAN由4个栈式自编码器网络(SAN)构成,每个自编码器网络都有四层网络,其中三个隐层使用sigomid函数激活,第四层是线性激活。每个SAN的分辨率都是逐渐变大的,定位越来越准确。第一个全局SAN定位了68个形状特征点,后面三个局部SAN的输入是由68个特征点在高分辨率图片周围提取的形状索引(SIFT特征)构成的,最终得到人脸在准确位置。[0024]步骤二、对经步骤一处理过的人脸图像,通过深度卷积神经网络进行人脸特征的提取;
[0025]进行人脸图像特征提取的网络结构如图2所示:其包含了6个卷积层(conv)和2个全连接层(fc),每个卷积层有2个3*3的卷积核;该网络结构通过修改现有的深度卷积神经网络AlexNet,将原有的5*5的卷积核拆分为2个3*3的卷积核,从而增加了深度,但同时计算量并未增加;此外本层的网络减少了每层的卷积核的数目,以及全连接层的节点数目,网络结构更简单。本实施例中还将残差网络结构(ResNet)引入卷积神网络,形成命名为稀疏残差网络的网络结构(Sparse-Residual Networks,SRN),其残差模块与原始残差模块有明显区别,拥有更多了输入链接,特征提取准确性更高,鲁棒性良好,稀疏残差网络的网络结构的表示形式如下:
4
CN 107273864 A[0026]
说 明 书
3/3页
ynl=y0l+y1l+y2l+...+yn-1l+fn(yn-1l)
[0027]其中y0l作为上一残差模块的输出,即第l-1残差模块的输出,同时作为第l模块的输入,y1l,y2l,y3l…fn(yn-1l)作为第l模块中的卷积层输出特征图,ynl作为第l模块的最终输出;
[0028]本实施例中,稀疏残差网络残差模块结构如图3所示,图3的最终展开形式如下:[0029]y4=y0+y1+y2+y3+f4(y3)
[0030]=y0+f1(y0)+f2(f1(y0))+f3(f2(f1(y0)))+f4(f3(f2(f1(y0))))[0031]图3的最终展开形式等价于图4,这样的三个残差模块构成了特征提取网络主体,之后进行降维处理。第一个全连接层fc1含有4124个节点,第二个全连接层含有2062个节点。所以最终一副人脸图像输入到网络中之后,输出的是一个2062维的特征向量。[0032]步骤三、将步骤二中输出的特征向量进行归一化处理,然后再与系统中原本存储的特征向量进行余弦相似度计算,最后进行阈值比较,得出人脸检测结果。[0033]本实施例基于深度学习的人脸检测方法,其采用稀疏残差网络提取人脸特征,具有提取速度快、准确度高、鲁棒性好、网络结构简单等优点。[0034]最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
5
CN 107273864 A
说 明 书 附 图
1/2页
图1
图2
图3
6
CN 107273864 A
说 明 书 附 图
2/2页
图4
7
因篇幅问题不能全部显示,请点此查看更多更全内容