基于异方差PLDA的AMM在三维人脸识别 - 蜂朝网
服务电话:021-62170626

基于异方差PLDA的AMM在三维人脸识别

时间: 2015-01-03 编号:sb201501031432 作者:蜂朝网
类别:职称发表论文 行业: 字数:3600 点击量:2156
类型: 免费    费用: 0元

本站提供专业的[留学生论文]定制业务,如需服务请点击这里给我发消息,联系电话:13671516250.

文章摘要:
本文是职称论文,为了更好地识别视频中的人脸,提出了一种基于异方差概率 LDA 的外观流形建模算法,通过构建分段局部线性模型,以高斯分布的集合建模,使用异方差概率线性判别分析(PLDA)学习,实验结果验证了本文算法的有效性及可靠性。

0 引言


由于视频图像有许多优点,视频人脸识别已经得到了广泛的应用,例如安防监控系统、手持设备和多媒体数据库等[1,2]。使用视频有益于提高识别率,视频包含的信息多于图像,分类的精确性、确定性和可靠性都会提高,这些信息也会用于观察条件不佳情况下的补偿,而图像人脸识别只允许在较低干扰系统下实现[3,4]。至今,学者们已经提出了许多视频人脸识别方法,例如,文献[5]提出了基于 SIFT 的 ATM 视频人脸识别算法,运用 SIFT局部特征匹配算法将提取的 10 帧正脸关键帧与人脸库图像进行特征匹配存储匹配结果,然后利用 RANSAC 算法将匹配后的图像做去除误匹配处理。文献[6]提出了一种建立在数据源分析基础上对典型人脸识别算法进行后处理的方法,有效地提高了现有典型识别算法的识别性能在无约束环境下的鲁棒性。为了解决识别结果不稳定的问题,文献[7]对视频监控中的人脸识别算法进行了改进,根据视频前后帧相关性对人脸运动进行估计并将其应用在视频监控的软件产品中.实验证明,有效地提高了传统单帧人脸识别算法的稳定性,具有较好的应用价值。为了在嵌入式系统中实现实时视频图像人脸识别,文献[8]提出了基于TI 系列 TMS320DM642 的快速人脸检测系统设计方案,测试结果表明,系统可靠运行,优化后系统运行速度提高,能够实现实时视频图像人脸识别。基于视频序列人脸自动检测是人脸跟踪、识别等研究的基础,文献[9]提出了一种结合图像增强技术、Gabor 特征变换和 Adaboost 算法的视频序列人脸检测方法,通过使用图像增强技术对图像进行光照补偿,减轻了不同的光照条件(如局部的阴影和高亮等)对检测结果的影响,实验表明,该方法能够在不同的光照条件下准确检测出人脸,显示出了较强的鲁棒性。文献[10]提出基于 B 样条的多级模型自由形式形变(FFD)弹性配准算法,先用低分辨率 FFD 网格全局配准,再对全局配准后的图像分块并计算对应子图块的相关性系数,对相关性系数小的子图块用高分辨率 FFD 网格局部细配准,在人脸畸变和表情变化很大的情况下,也能够精确的配准和很好的重建,得到较高识别率。为了能够实现视频下正面人体身份的自动识别,文献[11]设计的系统包括 Adaboost 行人检测、Adaboost 人脸检测、肤色验证、步态预处理、周期检测、特征提取以及决策级融合识别等模块,通过行人检测模块可以自动开启人脸检测模块和步态周期检测模块,实验结果表明,在单样本的步态识别中融合人脸特征可以有效地提高人脸识别的精度。文献[12]设计并实现了基于 Adaboost 和CamShift 算法的人脸检测和跟踪方法,通过实验得知该算法计算量小、跟踪速度快,并且不受人脸不规则运动和随意转动的影响,对场景中出现其他人脸不会出现误跟踪,对人脸被部分遮挡也不会出现跟踪丢失现象,大大提高了跟踪的匹配度和精度,证明了该算法的可行性和有效性。文献[13]在保局投影算法(LPP)及支持向量机(SVM)的基础上提出了一种基于相关反馈的视频人脸识别算法,该算法通过合理的数据建模提取出视频中的时空连续性语义信息,同时能够发现人脸数据中内在的非线性结构信息而获得低维本质的流形结构,还能通过反馈学习来增加样本的标记类别。尽管这些方法都取得了不错的识别效果,然而,在这些现存的方法中,大部分都是在非判别方式下执行的,在每个图像集上进行训练,不直接学习集之间的差别,往往不能很好地学习局部模型特定协方差。基于上述分析,为了更好地识别视频中的人脸,提出了一种基于异方差概率 LDA 的外观流形建模算法,通过构建分段局部线性模型,以高斯分布的集合建模,使用异方差概率线性判别分析(PLDA)学习,实验结果验证了本文算法的有效性及可靠性。


1 概率线性判别分析


概率线性判别分析或者 PLDA 是一个通用的模型,用于描述如何观察从潜在空间生成的人脸图像,分配适当的参数来对模型进行训练,以便它可以支持精确的预测和合理的不确定性估计。令 M 个视频中 M 个不同人1 2, ,...,MX X X 作为训练数据,每个视频是 D  1维矢量图像(或者是派生特征向量)的集合,如果用ijx 表示第i个人的第 j 幅图像,PLDA 的数据生成过程可表示如下:Honda/UCSD 数据集包含 20 个人的有姿势和表情变化的 59个视频序列,使用 Viola-Jones 检测器检测每帧图像,并将人脸图像裁剪为 20×20 灰度大小,然后使用直方图均衡化每幅图像,通过矢量化图像原始像素来提取特征向量。使用文献[9]中指定的标准训练/测试配置在这个数据集上执行实验,即 20 个序列用作训练集/图库,剩余的 39 个序列作为测试集,为了得到更详细的结果,对每个视频都执行了多次实验,并且限制了用于训练模型和识别视频的最大帧数目,使用与 FRGC v2 数据集相同的参数值执行实验,视频帧数分别设置为 50、100 及全长,表 2 列出了四种方法相对于不同最大帧数目的识别率。


2 算法提出


为了更好地识别视频中的人脸,提出了基于异方差概率现行判别分析的流刑学习方法,提出的方法包含两个部分:利用图库中所有视频的人脸进行外观流形建模;利用匹配探测和图库视频进行身份认证。为了完成这两个任务,采用了异方差PLDA 模型。图库中每个视频都包含一个人的各种人脸外观,使用分段局部线性模型对这些外观建模,首先通过聚集视频帧找到每个视频的局部结构,然后,使用异方差 PLDA 模型学习聚类结果,获得表征分布的参数。


3 实验


实验使用 MATLAB7.0 在个人计算机上实现,计算机配置为:Windows XP 操作系统、迅驰酷睿 2 处理器、 2.53 GHz 主频、4 GB RAM。在两个公开的三维人脸数据库:FRGC v2[14]和 Honda/UCSD[15]上对提出的方法作了评估,也将本文算法与其它文献中提出的方法作了比较实验在 FRGC v2 数据集的正面视图子集上执行,该子集包含在跑步机上行走的 25 个人的 99 个视频序列,每个人有 4 个序列对应于四个行走模型:慢、快、倾斜和抱球(缺少了一个人的持物序列),视频中包含姿势和表情的变化,对这些视频使用 Viola-Jones 探测器检测人脸,并将图像裁剪为 40×40 灰度大小,然后提取每幅图像的局部二进制模式(LBP)直方图特征集,划分图像为 25 个 8×8 像素的方块,在每个方块上计算以圆(8,1)为邻域的统一 LBP 直方图,产生的所有直方图连起来产生最终 1476×1 的特征向量。共执行了 12 次实验,得到识别率的平均值和标准差,最初,在原始基于行走模式分组上执行了 4 倍交叉验证,选取其中一个组为训练集/图库,剩下的作为测试集,在每个视频打乱分组前重复两次交叉验证,每次实验中,使用标准 PLDA 聚类训练集中的图像,使用异方差 PLDA 学习,然后与测试集比对。令 F 中包含24 个基础向量,每个G 中也包含24个基础向量。对文献中提到的其他三种较为先进的视频人脸识别方法进行了测试比较,包括 MSM[4]、SANP[15]和标准 PLDA[12]、SIFT 算法[5]、隐马尔可夫模型(HMM)[6]、基于 DSP 的视频人脸识别算法(DSP)[8]、多级 FFD 配准视频人脸算法(ML-FFD)[10]、基于相关反馈的视频人脸算法(RF-VFR)[13]。其中,SANP 因其高识别率而被认为是最先进的算法;对于 MSM 来说,需要选择特征向量的数目,以便能保留 98%的总特征值;对于 SANP,标准参数值使用文献[15]中建议的值,平均识别结果如表1所示。


4 结束语


为了更好地识别视频中的人脸,提出了基于异方差概率线性判别分析的外观流形建模算法,以高斯分布集合作为人脸外观流形模型,采用了异方差概率线性判别分析(PLDA)来判别性的学习流形。在训练期间,对从视频中采集的人脸图像进行聚类,同时学习所有人的聚类。在两个基准数据库上进行了实验,将提出的方法与其它几种视频人脸识别算法进行了比较,虽然匹配策略很简单,但提出的方法能获得较高的识别率,表现出的性能也很稳定,并且具有较低的时间复杂度和空间复杂度,标准和异方差 PLDA 之间的比较也证实了局部模型特定协方差建模的有效性。未来会将本文算法应用到其它的视频人脸数据集上,进行大量的实验,在提高识别率的同时,进一步降低算法的计算复杂度,从而更好地运用于实时人脸识别系统。


如需定做,职称发表论文请联系我们专家定制团队,QQ337068431,热线咨询电话:021-62170626
分享到: