文献综述(或调研报告):
目前,国内外学者对于人脸对齐已经有了较深的研究,取得了极大的进步,主要的人脸对齐算法可以分为以下几类:
- 基于灰度信息的方法[1]。
人脸上的五官附近区域例如眼睛、鼻子、嘴巴等区域在图像上最为明显,这些区域的像素灰度分布存在某种模式,特点较为明显,因此可以通过灰度分布的特点快速找到这块人脸的核心区域,在核心区域内对特征点进行匹配相比于在全脸区域进行匹配要容易得多。
- 基于先验规则的方法[1]。
人脸的结构基本上是一致的,五官相对位置也是确定的,因此可以先对图像做一定的变换,使得某些特征得到强化,然后根据上述的已知信息先验地定位人脸特征点。
- 基于几何形状的方法。
基于几何形状的算法研究较早,这种算法通过部署用参数表示的模型来描述人脸外观和形状,这些参数包括尺度、角度和位置。主要是主动外观模型(AAM)[2]和主动形状模型(ASM)[3]。主动形状模型(ASM)通过对手动标记的训练样本进行主成分分析并使用学习的人脸形状逐渐拟合测试图像中的人脸实例来表示人脸形状。主动外观模型(AAM)使用外观模型进一步重建整个人脸,并通过最小化纹理残差来估计人脸形状。AAM算法与ASM算法一起提供了解决人脸对齐问题的一般框架。不过,在研究之后表明,经典的AAM方法由于涉及基于梯度下降的优化而在计算上冗杂,并且对初始化较为敏感,因此在计算上很昂贵,效果也不好,基本已经被淘汰。
- 基于回归的方法。
上述方法由于各种缺陷基本已经不再使用。基于回归的人脸特征点定位算法是近几年的一个研究方向,可以看作是上述主动形状模型(ASM)的一个改进方向。基于回归的方法直接学习从图像特征到人脸形状的映射函数。根据输入的图像特征,通过回归函数直接得到较为准确的人脸特征点位置,基于回归的方法由于不需要对获取图像纹理进行大量计算,因此可以提高特征点定位的速度。这些方法之间的区别主要在于所采用不同的学习算法(例如,增强、随机森林或非线性最小二乘)和采取特征(例如,哈尔小波、随机蕨或SIFT)。Xiong X等人在2013年的论文中提出的监督梯度下降(SDM)[4][5]方法,通过回归矩阵学习从SIFT特征到人脸特征点位置之间的回归映射,在人脸对齐领域影响较大。之后针对SIFT特征提取耗时的特点, Ren S等人提出了局部二值特征法(LBF)[6]对模型进行改进,其他人也都进行了进一步优化,这些方法使用了更简单的形状索引特征以及基于决策树的回归方式,配以级联的流程,使得人脸对齐算法的速度和精度都有了较大的提升。通过每次更新人脸形状假设时重新计算特征而获得的形状特征索引,对于学习稳健的对齐模型来说非常重要。此外,利用由人脸检测器提供的初始形状,从形状特征索引到人脸特征点位移的映射提供了自然且有效的方式来迭代地更新人脸特征点定位。由于映射函数通常是高度非线性的,因此训练它们需要许多带注释的样本,并且需要相当长的时间来学习复杂的关系。基于回归的算法较为成熟,其他影响较大的算法还有显示形状回归法(ESR)[7][5]等。同时,对于多视图和具有严重遮挡的人脸图像特征点定位算法也有了较为深入的研究,如Junliang Xing等人提出的阶段性相关字典(SRD)[8]模型,以及拓展应用的HSRD、OSRD模型,对于多视图和有着严重遮挡的人脸图像有着良好的性能。
- 基于深度学习的方法。
基于深度学习的方法在2013年之后逐渐取代了基于回归的方法,成为人脸特征点定位算法领域的主流方向。深度学习的优势是不必自己设计特征,只需要设计网络结构或者利用已经成熟的经典网络结构就可以进行人脸特征点的回归,并可取得不错的效果,上述的回归方法提取SIFT、HOG等复杂特征时耗时太多,而提取简单的形状索引特征虽然效果和速度都非常不错,不过灰度图提取的简单特征还是会损失一些信息。深度学习的主要优势在于,不考虑速度,能达到比基于回归的方法更高的精度,也因此,一般的基于深度学习的方法不如一些先进的回归算法,如上述提到的局部二值特征法(LBF)。香港中文大学的汤晓鸥教授团队在2013年提出DCNN[9]方法,利用卷积神经网络(CNN)将5个关键点的定位精度提升到很高的水平,在数据库LFW上达到了97.45%的分类精度,之后基于深度学习的方法逐渐取代了基于形状索引和决策树的传统回归方法。2013年后的一些基于深度学习的方法主要通过表达能力更强的网络结构或通过更有效的损失估计来改进DCNN方法[10]。
[参考文献]
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。