基于卷积神经网络的人脸识别检测分析

发布时间:2023-08-22  

基金项目:河南省高等学校青年骨干教师培养计划,项目编号:2021GGJS190

本文引用地址:

0 引言

技术的关键就在于人脸检测,作为重要研究方向广泛应用于模式识别和计算机识别领域[1]。人工设计特征作为传统人脸检测方法的重要监测依据。目前由于人脸检测算法表现出较高的,因而应用于多个领域[2]。人脸检测算法结合深度学习在得到广泛应用下逐渐获取进一步发展,早已作为主流研究方法应用于各领域,检测准确率高于传统方法,超过95%[3],拓展研究具有重要的意义。

近年,技术早已被Facebook、Google、商汤科技、旷世科技应用融入到各个领域,尤其是在不断持续进步发展的趋势[4]。很多挑战和问题在实际应用环节始终存在。尽管从识别准确度来看,在LFW 数据集中应用多种方式均可获取较佳结果,人眼识别能力也得到显著提升,然而必须要选取大量训练样本训练各深度模型,倘若研究机构场所小型化或属于高校,实现相对较为困难[5]。所以目前亟需解决的主要问题就在于怎样训练可满足人脸匹配要求和快速区别人脸特征的性能佳且结构简单[6]。本文应用到人脸识别领域,并开展网络训练以及测试优化分析。

1 基于卷积神经网络的人脸检测算法

图1给出了AlexNet网络模型结构图。网络模型中全连接层和卷积层分别为3 个和5 个,总共为8 层。将ReLU、局部响应归一化及池化层增加至前两层后,将Dropout 和池化加入到第6、7 层,并在第8 层应用softmax 分类器[7]

1692677824557455.png

图1 AlexNet

将Dropout 技术引进全连接层中,这种情况下全连接层在AlexNet 网络模型训练整个流程中的连接概率为固定且以随机稀疏方式为主,将部分神经元丢弃,有利于网络复杂度降低,参数计算量得到减少,过拟合现象也会在某种程度上减小[8]。需采取局部归一化操作方式处理输出结果,有效抑制局部神经元,进而促进网络泛化能力的进一步强化。

网络模型算量与卷积核结构尺寸大小相关,感受也随着卷积核尺寸增大而扩大,尽管图片特征信息提取效率有效增加,但计算参数急剧增加。小尺寸的卷积核被更多研究学者应用,可有效增加模型的宽度和深度。网络参数模型训练时长将得到显著减少,同时还有利于降低第一层的参数计算量。

在人脸检测时应用本文提出的网络模型,需提前区分人脸及非人脸区域,为确保降低神经网络参数,将第2 个全连接层删除,仅将第1、第3 个全连接层保留。按照1×1 卷积核尺寸标准修改第1 个全连接层,用全连接神经网络替代原有神经网络,任意大小的尺寸均可输入卷积神经网络,人脸分类选用第2 个全连接层。本文所用的参数见表1 所示。本文所用的逻辑见图2 所示。

1692678063689022.png

图2 网络结构逻辑图

将Dropout 技术引进全连接层中,这种情况下全连接层在AlexNet 网络模型训练整个流程中的连接概率为固定且以随机稀疏方式为主,将部分神经元丢弃,有利于网络复杂度降低,参数计算量得到减少,过拟合现象也会在某种程度上减小[8]。需采取局部归一化操作方式处理输出结果,有效抑制局部神经元,进而促进网络泛化能力的进一步强化。

网络模型算量与卷积核结构尺寸大小相关,感受也随着卷积核尺寸增大而扩大,尽管图片特征信息提取效率有效增加,但计算参数急剧增加。小尺寸的卷积核被更多研究学者应用,可有效增加模型的宽度和深度。网络参数模型训练时长将得到显著减少,同时还有利于降低第一层的参数计算量。

在人脸检测时应用本文提出的网络模型,需提前区分人脸及非人脸区域,为确保降低神经网络参数,将第2 个全连接层删除,仅将第1、第3 个全连接层保留。按照1×1 卷积核尺寸标准修改第1 个全连接层,用全连接神经网络替代原有神经网络,任意大小的尺寸均可输入卷积神经网络,人脸分类选用第2 个全连接层。本文所用的网络结构参数见表1 所示。本文所用的网络结构逻辑见图2 所示。

表1 网络结构参数

1692678152907909.png

2 实验结果分析

2.1 数据集

作为评测数据集,FDDB 常用于人脸检测。灰度和彩色图共2 845 张图片均包含在数据集中,共有5 171人脸标注数据,人脸拍摄环境为自然状况。测试集挑战性较高,同时低分辨率、遮挡等情况都包含在内,拍摄环境与日常应用场景都十分贴近。

作为人脸检测的大型基准数据集,WIDERFace 由香港中文大学建立而成。采用手工标注数据集,人脸总数为4 万张,光照及遮挡等不同场景下人脸图像变化情况均包含在内。

2.2 网络模型训练设置

本文在训练改进卷积神经网络时,将Tensorfl ow 深度学习开源平台作为重要应用工具,选取NVIDIAGTX1050 型GPU 加速,训练数据用SSD 固态硬盘缓存,完成CUDA9.0GPU 并行计算库的安装。

网络训练基于网络参数完成,同时将0 作为卷积层学习率,训练的卷积层为候选框生成网络特有,为确保能实现卷积神经网络中人脸分类及候选框生成网络间的共享,最后环节需要微调人脸分类网络。

2.3 实验结果分析

在人脸检测中对本文改进的模型结构性能进行验证,选取测试的数据集为FDDB 人脸数据集。召回率要求在实际使用过程中的严格程度更深,所以评估本算法应用的评价指标以FDDB 为主,Falsepositive 表示横轴,即FP,误检数为检测出人脸但实际非人脸的数量,Truepositiverate 表示纵轴,即recall 召回率。如图3 所示,为测试曲线图。

本文对比了CascadeCNN 及MTCNN 等较为经典的人脸检测算法,测试评价方法均选用FDDB 数据库实现,另外还对比了各检测方法所耗费的时长,下图为各检测算法对应的数据结果。

1692678273424294.png

图3 FDDB评价图

算法比较结果见表2。其中,fps 表示检测速度,即每秒传输的帧数。通常算法检测速度随帧数增长而加快。本文主要是在GPU 上完成检测速度的统一测试。与CascadeCNN、MTCNN,两种算法相比,本文算法表现出较高的召回率,对比表中数据得出准确率最高,相比于MTCNN 和CascadeCNN 检测速度较低,人脸签到系统的基础需求得到满足。

表2 算法比较

1692678358661165.png

为了确保人脸检测算法多个特征能更直观且清晰地显示,在开展人脸检测验证前采用随机方式挑选图片,图4 为检测具体结果。侧脸及戴头盔遮挡的单人照片依次如图(a)(b)所示,通过观察对比得出,检测人脸图片的准确度及清晰度均相对较高,这意味着对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。

image.png

(a)

image.png

(b)

图4 测试结果图

3 结束语

本文开展基于卷积神经网络的人脸识别检测分析,得到以下有益结果:

1)本文算法表现出较高的召回率,人脸签到系统的基础需求得到满足。

2)对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。

参考文献:

[1] 姜绍忠,姚克明,陈磊,等.基于CNN与Transformer混合模型的口罩人脸识别方法[J].传感器与微系统,2023, 42(1):144-148.

[2] 徐武,陈盈君,汤弘毅,等.局部特征映射与融合网络的人脸识别优化算法[J].河南科技大学学报(自然科学版),2023, 44(02):59-64+72+7-8.

[3] 仲崇丽,刘华.改进卷积神经网络的热红外成像人脸识别[J].激光杂志,2022,43(12):117-121.

[4] 季瑞瑞,谢宇辉,骆丰凯,等.改进视觉Transformer的人脸识别方法[J].计算机工程与应用,2023,59(8):117-126.

[5] 赵洪坡,刘显梅.数据挖掘的热红外成像人脸识别研究[J].激光杂志,2022, 43(11):47-51.

[6] 孙金龙,吴振宁,肖仲喆,等.关于人脸识别算法对不同照明技术的鲁棒性研究[J].电子器件,2022, 45(5):1123-1128.

[7] 马倩,马祥.联合松弛块对角表示矩阵回归的遮挡人脸识别[J].计算机应用研究,2023,40(2):612-616+633.

[8] 张晨晨,王帅,王文一,等.针对人脸识别卷积神经网络的局部背景区域对抗攻击[J].光电工程,2023,50(1):113-125.

[9] 戚琦,马迎新,王敬宇,等.面向算力受限边缘环境的双分支多尺度感知人脸检测网络[J].通信学报,2020,41(8):165-174.

[10] 皮家甜,杨杰之,杨琳希,等.基于多模态特征融合的轻量级人脸活体检测方法[J].计算机应用,2020,40(12):3658-3665.

[11] 王艺皓,丁洪伟,李波,等.复杂场景下基于改进YOLOv3的口罩佩戴检测算法[J].计算机工程,2020,46(11):12-22.

(本文来源于《电子产品世界》杂志2023年8月期)

文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    基于卷积神经网络的人脸识别检测分析;基金项目:河南省高等学校青年骨干教师培养计划,项目编号:2021GGJS190本文引用地址:0 引言 技术的关键就在于人脸检测,作为重要研究方向广泛应用于模式识别和计算机识别......
    系统中,我们需要: 选择3D面部识别或3D飞行时间等技术来收集高质量图像数据。 选择卷积神经网络(ConvNet/CNN)等AI算法来从原始图像数据中提取有意义的内容和动作,从而获取信息。 寻找......
    对人工智能和机器学习的意义。CNN是一种能够从复杂数据中提取特征的强大工具,例如识别音频信号或图像信号中的复杂模式就是其应用之一。本文讨论了CNN相对于经典线性规划的优势,后续文章《训练卷积神经网络:什么......
    的方法包括结构光、立体匹配、SLAM(同时定位与地图构建)等。 6. 视频分析与处理方法:这种方法涉及在视频序列中进行运动分析、行为识别、事件检测等任务。常见的方法包括光流、动作识别、时空卷积神经网络(3D-CNN)等......
    有许多种类型,但本系列文章将只关注卷积神经网络(CNN),其主要应用领域是对输入数据的模式识别和对象分类。CNN是一种用于深度学习的人工神经网络。这种网络由输入层、若干卷积层和输出层组成。卷积......
    ,深度学习模型便受到广泛关注而迅速发展。常用的深度神经网络模型有深度信念网络(DBN)、受限玻尔兹曼机(RBM)、循环神经网络(RNN)、卷积神经网络(CNN)等。利用......
    些方法往往受限于规模和灵活性。随着机器学习的发展,尤其是支持向量机(SVM)和随机森林等算法的应用,文本分类的准确性和适应性有了显著提高。进入深度学习时代,卷积神经网络(CNN)和循环神经网络(RNN)等模......
    的研究更加精准。第4阶段,大数据时代的到来,人脸识别的数据库不断壮大,CNN 卷积神经网络等算法的涌现不断地推动着人脸识别的发展。 1.2 1.2.1 人脸表情识别的要素 在20 世纪......
    早在1989年就已经问世了,最初人们用它解决手写字符的识别问题,但是受限于当时计算机的硬件水平,其处理速度较慢,并没有推广到其他应用领域。1999年GPU的问世为卷积神经网络......
    为弯曲传感器的comb-shaped TENG(CS-TENG)组成,灵敏度达到110V/kPa,经过20000次按压测试后仍能维持稳定输出。最后结合一维卷积神经网络,该仿生传感系统实现了实时物体识别功能。 这项......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>