人脸表情活跃区域定义及获取文献综述

 2022-03-15 20:24:15

面部表情属于生物形体语言的一部分,能够反映出生物的生理及心理变化,在与其进行交谈时,可以观察对方的面部表情,是情感交流的重要渠道。早在19世纪达尔文在他的论著《人类和动物的表情》中就曾对于表情原理进行过相关的阐述,来介绍人和动物的表情特性以及表情含义。

到了20世纪70年代,美国心理学家Ekman和Friesen经过大量的实验测试得出结论,将高兴(Happy)、生气(Angry)、吃惊(Surprise)、恐惧(Fear)、厌恶(Disgust)和悲伤(Sad)定义为人类的 6 种基本表情,在之后的表情识别领域中关于表情的研究基本都是参照这六种基本表情进行分类。直到 20 世纪 90 年代,Mase和Kenji提出了一种新的理论:利用光流法对人脸面部表情进行识别[2]。从那时起,越来越多的研究人员开始使用计算机技术来对人脸表情特征进行提取和分类,进行人脸关键点的相关研究。

面部关键点定位指的是给定待检测的人脸图像,检测算法可以将诸如五官或面部轮廓等关键点进行检测标定,现有的人脸关键点检测方法大致分为3种,分别是基于模型ASM(Active Shape Model)和AAM(Active Appearance Model)的传统方法;基于级联回归(Cascaded Regression)的方法;基于深度学习的方法。

1.传统方法

1.1经典传统方法

1995年的时候,Cootes等人提出了主动形状模型(ASM)的计算方法[4],这个算法的基础是点分布模型(PDM)并在此基础上进行了修改,同样属于有监督学习,使用带有标签的训练数据来构建面部关键点的形状模型,是一种经典的面部关键点定位的方法,ASM 算法的优点在于模型简单直接,架构清晰明确,易于理解和应用,而且对轮廓形状有着较强的约束,但是其近似于穷举搜索的关键点定位方式在一定程度上限制了其运算效率。之后的 1998年,Cootes 再次对 ASM 算法进行了修改,并设计了一种名为主动外观模型(AAM)的算法[5],AAM 不仅采用了面部关键点的几何形状作为约束任务,相较于ASM,还将整个面部的纹理特征加入到了约束任务中,其检测效果要优于ASM。基于模型ASM及AAM的传统方法都是通过迭代求解一个在各种约束条件下的优化问题来提取面部形状特征,一方面容易陷入局部极小的问题,另一方面也存在计算复杂、计算速度慢的问题。

1.2基于级联回归方法

2010年,Dollar 设计了一种名为级联姿势回归(CPR)算法[6],该方法是一种基于级联回归形状框架的集成学习的方法,该算法通过级联多个回归器来不断调整每一级对于面部关键点的估计值,从而不断地逼近关键点的真实分布情况,DCNN 采用级联回归的思想,从粗到精的逐步得到精确的关键点位置,不仅设计了三级级联的卷积神经网络,还引入局部权值共享机制,从而提升网络的定位性能。最终在数据集 BioID 和 LFPW 上均获得当时最优结果。

Zheng等人于2019年基于卷积神经网络及级联回归思想,提出了一种优化的两个阶段的人脸关键点检测算法[13]。使用浅层卷积网络将整个人脸图像作为输入,初始预测出较高精度的关键点位置;级联的更加浅层的卷积网络分别对初始预测的关键点位置进行精确,其输入为以初始预测关键点为中心的较小的矩形区域。使用公共数据集LFPW来训练模型,检测人脸的左右眼、鼻部及左右嘴角5个关键点,并对比不同级联结构对检测结果的影响。通过数据增强相关技术来增加数据以提高模型的泛化性能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。