Computer Science and Application 计算机科学与应用, 2011, 1, 81-86 http://dx.doi.org/10.12677/csa.2011.12017 Published Online September 2011 (http://www.hanspub.org/journal/csa/) Copyright © 2011 Hanspub CSA The Study of Face’s Orientation Recognition Based on the PCNN* Yu an Li, Xia W ang, Yang Yang School of Information Engineering, HeBei University of Technology, Tianjin Email: mzpliyuan@126.com Received: Aug. 4th, 2011; revised: Aug. 20th, 2011; accepted: Sep. 1st, 2011. Abstract: The feature extraction of face orientations is the key of the face’s orientation recognition. In this paper, four methods including entropy sequence, logarithmic series, time series, and standard deviation series based on the PCNN have been introduced to extract the features of face orientations. It is able to achieve the transform from multi-di mensional information to one-dimensional information. The classified results of loga- rithmic series which are impacted by salt & pepper have been analyzed. The method of Euclidean distance has been used to classify and recognize the face orientations. The results prove that the method based on logarithmic series whose accurate identification rate was 96% has certain antinoise ability. Keywords: PC NN; Face’s Orientation Recognition; Feature Extraction; Feat ure Sequ e nce 基于脉冲耦合神经网络的人脸朝向分析* 李 媛,王 霞,杨 洋 河北工业大学信息工程学院,天津 Email: fanning821 2298@163.com 收稿日期:2011 年8月4日;修回日期:2011 年8月20 日;录用日期:2011 年9月1日 摘 要:人脸朝向特征提取是人脸朝向识别的关键。本文采 用基于脉冲耦合神经网络 (Pulse Coupled Neural Network,简称 PCNN)的特征提取方法,分别基于其熵序列、对数序列、时间序列、标准方差 序列,完成了多维信息到一维信息的转化,并针对椒盐噪声影响下对数序列的分类效果进行分析。通 过欧氏距离法进行人脸朝向的分类识别,结果表明,基于 PCNN对数序列对人脸朝向特征提取的正确 率可达 96%,并且具有一定的抗噪能力。 关键词:PCNN;人脸朝向识别;特证提取;特征序列 1. 引言 随着近年来科学技术的快速发展,人脸识别技术 的应用越来越广泛。人脸识别作为生物识别领域中最 自然、最可靠的技术,在科技领域有着很重要的作用。 图像在采集过程中,人脸是有多种朝向的,这就增加 了人脸识别算法的复杂度。所以在人脸检测阶段可以 把人脸图像分成不同朝向的类,这样就缩小了人脸识 别中进行搜索的搜索范围。 朱玉华[1]等提出一种基于特征三角形的驾驶员头 部朝向分析方法,文献[1]中将头部质心、左眼中心点 和右眼中心点作为特征三角形确定驾驶员头部朝向, 该方法具有较好的实时性并能够解决头部旋转不确定 性问题,文献[2]中提出一种鲁棒的全自动人脸特征点 定位方法,通过自动定位正面人脸的两眼,以人眼定 位结果作为初始化进行人脸特征点定位来判断人脸朝 向。文献[1,2 ]中的人脸朝向分析方法在脸部旋转角度 *基金项目:河北省高等学校自然科学研究青年基金项目 ( NO.2010121 ) 。 李媛 等基于脉冲耦合神经网络的人脸朝向分析 82 | 较 大时会存在漏检情况,并且没有注意到噪声对图像特 征提取的影响。 如何快速、有效地提取人脸朝向特征是人脸朝向 识别的关键。PCNN[3]直接来自于哺乳动物视觉皮层神 经细胞的研究,有别于传统多层网络,是单层的自监 督自学习的人工神经网络,不需要提前进行训练,很 好地完成了多维信息到一维信息的转化,极大地削减 了运算量和数据存储,实现了快速提取图像特征。 PCNN 具有提取图像形状、边缘、纹理的属性,用于 特征提取时具有平移、旋转、尺度、扭曲等不变性[4], 同时它还有很好的抗噪性,因此在人脸旋转角度较大 时也能够很好的反应图像的信息,所以用 PCNN 对人 脸朝向进行特征提取就有了理论依据。 本文基于脉冲耦合神经网络(PCNN)的熵序列、对 数序列、时间序列、标准方差序列对人脸 5个朝向进 行研究分析,还通过对加噪图像识别来分析 PCNN特 征提取方法的抗干扰能力。 2. 基于 PCNN 特征序列的人脸朝向分析 2.1. 脉冲耦合神经网络(PCNN)的原理介绍 脉冲耦合神经网络神经元模型依据的是哺乳动物 大脑视觉皮层神经元脉冲串同步震荡现象的工作机 理,是模拟视觉神经细胞活动而得到的人工神经元模 型[5]。它所具有的脉冲耦合特性使其在处理过程中既 实现了空间累加又实现了时间累加,并通过控制耦合 调制来模仿生物神经元的疲劳与不应期[6]。因此, PCNN 模型能更好地模拟生物神经元。 一个 PCNN 神经元由三部分组成[7]:接收部分, 调制部分,脉冲发生器,其基本模型见下图 1: PCNN 模型表达式: exp 11 ijFijFijkl klij F nFnVmYn I(1) 接 收 部 分 0 1 阈值电压 阶跃函数 调制部分 脉冲产生 1ij L V 1 ij Yn ij I 1 ij F ij U ij Yn ij Figure 1. A PCNN neuron model 图1. PCNN神经元模型 exp 11 ijLijLijkl kl LnLnV wYn (2) 1 ij ijij Un FnLn (3) 1, 1 0, 1 ij ij ij Un n Yn Un n (4) exp 11 ijij kl nnVY n (5) exp 11 ijE ijEkl EnEnV Yn (6) 其中,Fij[n]就是第(i,j)个神经元的 n次反馈输入; Lij[n]为线性连接输入项;Iij 为外部输入刺激信号;Eij[n] 为内部活动项 U能否激发脉冲产生所需的动态门限; 为突触之间连接强度常数;Yij[n]是PCNN 脉冲输出。 当PCNN用于图像识别时,每个像素对应一个神 经元,每个神经元与邻近的神经元相连接;记下每次 迭代过程中整幅图像中点火的神经元数,这样经过一 定的迭代次数后,就得到了一个反映了待识别图像特 征的序列。它反映了输入图像的灰度分布信息,还反 映了相邻像素之间的相对位置信息,这是其可作为特 征信息的关键所在[8]。 2.2. 提取人脸朝向特征 一幅二维灰度图像输入PCNN 模型后,将产生一 系列的脉冲图像输出。由于只有0和1两种取值,这 些脉冲图像也被称为二值图像。这些二值图像序列包 含有原始图像的大量特征信息,但是它们却并不能作 为原始图像的特征进行分类识别,因为它们的数据量 太大了,这种情况下就需要对这些二值图像序列进行 某种变换以达到减少数据量的目的,并且变换后的数 据还可以作为原始数据的特征。 本研究通过对每次扫描后二值图像的输出分别进 行处理,扫描 30次后,得到一个 30维的序列。我们 把人脸的朝向大致分为左方、左前方、前方、右前方、 右方。本研究的试验样本是相机拍摄的一组学生相片, 每个朝向各拍摄5张,分别对这5个朝向(共25 张)进 行特征提取,然后再另取25张图片作为待识别图片, 用于判别朝向。 本研究分别用4种方法(熵序列、对数序列、时间 序列、标准方差序列)提取人脸朝向特征,通过计算特 征序列与未知人脸朝向序列的欧氏距离[7]来判断人脸 的朝向,再依据各自的准确率来比较4种方法的优劣。 Copyright © 2011 Hanspub CSA 李媛 等基于脉冲耦合神经网络的人脸朝向分析83 | 系列 将一幅二维灰度图像输入PCNN模型后,产生一 的脉冲图像输出,计算PCNN 每一次输出的二值 图像的熵值,这样也就得到了一维的熵序列En[n], En[n] = Entropy(Y[n])。Y[n]为PCNN 第n次输出的二 值图像。根据 Shannon关于熵的定义可知,二值图像 的信息熵可用下式计算: 12 log 1 020 log H PP PP P (7) 其中,H(P)为二值图像的信息熵;P1、 示出 值图像 Y[n]中有边缘、形状、 纹理 (8) P P0分别表 现1和0的概率。 PCNN 迭代输出的二 等几何信息,我们探索应用以下 4种特征提取方 法。4种方法的数学表达式如下: 熵序列: 12 logePP 对数序列: (9) 22 loge 时间序列: 3,ij eY n 标准方差序列: (10) 2 n 4,ij eY 即扫描次数;熵 (11) 其中,n为迭代次数,序列是对PCNN 每次迭代输出的的二值图像的熵进行求和;对数序列 是对 PCNN 每次迭代输出的二值图像对数进行求和; 时间序列是对 PCNN 每次迭代输出的二值图像 Y[n]进 行求和; 是每次迭代输出的Y[n]的平均值。 具体步骤如下: (1) 将一组(5个)向左方朝向的人脸图像分别通过 PCN 得人脸其他 4个朝向的特征 序列 别求得每张人脸 的特 30 次扫描,得到具有 30 个 特定人进行人脸朝向分析。本 组实 N扫描,得到 5个特征序列对其求平均,得到此 类朝向的特征序列A; (2) 用同样的方法求 分别用 B、C、D、E来表示; (3) 另取25个未知朝向人脸,分 征序列,通过计算其与5个朝向的特征序列的欧 氏距离,判断其人脸朝向。 2.3. 实验结果及分析 分别对每幅灰度图像进行 元素的熵序列。 下面我们针对某一 验共拍摄了50张人脸朝向图片。图 2为用于提取 人脸朝向特征的25张人脸灰度图像,图 3为待识别的 另外 25张人脸灰度图像。 Figure 2. Images for feature ext ract ion 图2. 特征提取用图 Figure 3. To-be-recognized imag 得人脸朝向左方的特征熵序列: .0015 0.0015 11 0.0111 .0046 0.0046 es 图3. 待识别图像 求 A = [0 0 0 0 0.8137 0.8136 0.8136 0.8055 0.8057 0.8057 0.8057 0.8057 0.8057 0.8057 0.8057 0.8158 0.8158 0.9840 0.9843 0.8785 0.9951 0.8568 0.9882 0.9414 0.9253 0.7649 0.8728 0.6902 0.8263] 求得人脸朝向左前方的特征熵序列: B = [0 0 0 0.01 0.9544 0.9536 0.9536 0.9446 0.9454 0.9454 0.9454 0.9449 0.9449 0.9449 0.9450 0.9454 0.9454 0.9969 0.9970 0.8360 0.9844 0.8284 0.9969 0.8669 0.9938 0.7201 0.9735 0.6598 0.9526] 求得人脸朝向前方的特征熵序列: C = [0 0 0 0 0.9232 0.9229 0.9229 0.9043 0.9046 0.9046 0.9047 0.9044 0.9044 0.9044 0.9045 0.9207 0.9207 0.9916 0.9953 0.8474 0.9983 0.8159 0.9974 0.8527 0.9718 0.7238 0.9162 0.6804 0.8723] Copyright © 2011 Hanspub CSA 李媛 等基于脉冲耦合神经网络的人脸朝向分析 84 | 135 0.0135 0.0030 0.0030 用2 列的特征提取 方法 的人脸图像加入椒盐噪声进 行研 盐噪 欧氏 A7 左前 前方 D7 右前 E7 求得人脸朝向右前方的特征熵序列: D = [0 0 0 0.0 0.9835 0.9829 0.9829 0.9772 0.9778 0.9778 0.9778 0.9774 0.9774 0.9774 0.9775 0.9782 0.9782 0.9897 0.9901 0.8111 0.9590 0.7922 0.9871 0.8406 0.9994 0.7103 0.9899 0.6683 0.9708] 求得人脸朝向右方的特征熵序列: E = [0 0 0 0.7116 0.7111 0.7111 0.6999 0.7004 0.7004 0.7004 0.7004 0.7004 0.7004 0.7004 0.7089 0.7089 0.9846 0.9831 0.8832 0.9967 0.8999 0.9677 0.9551 0.8849 0.7616 0.8300 0.6638 0.7728] 表1为部分实验结果。A、B、C、D、E分别代表 5个人脸图像提取出的五个朝向的特征熵序列, A7、B7、C7、D7、E7分别代表另 25 个待识别人脸中 的5个人脸图像的特征熵序列,分别计算其与A、B、 C、D、E的欧氏距离。从表 1实验结果中可以看出, 只有标号是C7的人脸朝向识别错误(C7应为前方,误 判为左方),对 25 张人脸朝向图像的识别情况进行统 计发现其识别正确率为88%。将另外3种基于 PCNN 的特征提取方法与欧氏距离法相结合统计其识别正确 率如表 2所示,从表 2中可以看出这 4种方法中基于 对数序列的特征提取方法对于人脸朝向的识别情况是 最好的,识别正确率为96%。 3. 有噪图像的人脸朝向识别 实验已经证明 4种方法中,对数序 与欧氏距离相结合对于人脸朝向识别的效果是最 好的,选取 20 张可以用此方法正确识别的不同朝向的 人脸,并对其随机加入不同程度的椒盐噪声[9],对加 噪后的图像进行识别。 我们用一幅正面朝向 究分析。加噪图像及其对数序列曲线图如图 5。 图4中第一行从左向右依次是原图、加入 1%椒 声后的图像、加入 2%椒盐噪声后的图像;第二 行从左到右一次是加入 3%椒盐噪声后的图像、加入 4%椒盐噪声后的图像、加入 5%椒盐噪声后的图像。 图5中第一行从左向右依次是原图的PCNN对数 Table 1. The Euclidean distance for entropy sequence 表1. 熵序列的欧氏距离 距离 左 B7 C7 右 A0. 0. 左 0238 0.3085 0.0352 0.4371 0679 B左前 0.1553 0.0006 0.1635 0.0183 0.6330 C前方 0.0665 0.0353 0.0579 0.0792 0.4241 D右前 0.2684 0.0137 0.2717 0.0006 0.8450 E右 0.2940 0.8806 0.3059 1.0935 0.0192 Table 2. Comparison of four m et hod recognition accuracy 特征 熵 标准方差序列 表2. 四种方法识别正确率比较 序列 对数序列 时间序列 识别正确率 88% 96% 92% 84% 序列曲线图、加入1%椒盐噪声后的图像的 PCNN 对 在图 像中 20 幅图像的识别情况作一个 统计 数序列曲线图、加入 2%椒盐噪声后的图像的 PCNN 对数序列曲线图;第二行从左到右依次是加入 3%椒 盐噪声后的图像的PCNN对数序列曲线图、加入4% 椒盐噪声后的图像的PCNN对数序列曲线图、加入5% 椒盐噪声后的图像的PCNN对数序列曲线图。 从PCNN对数序列的曲线图中可以看出,当 加入 1%,2%,3%的椒盐噪声时,曲线图与原图 的对数序列曲线图相比变化不大,可以正确识别;当 加噪为4%时,第五次扫描后的对数值明显变小,对 图像的正确识别已经可以产生影响;当加噪 5%时, 第一次扫描后的对数值变得很大,已经不能很好的反 应原灰度图像的信息。 把加入不同噪声的 ,如表3。 Figure 4. Original image and its noise images which adding salt & pepper noise 图4. 原图及其加入不同椒盐噪声后的图像 Copyright © 2011 Hanspub CSA 李媛 等 | 基于脉冲耦合神经网络的人脸朝向分析 Copyright © 2011 Hanspub CSA 85 05 1015 2025 30 0 2 4 6 8 10 12 05 1015 2025 30 0 2 4 6 8 10 12 05 10 1520 25 30 0 2 4 6 8 10 12 05 10 15 20 25 30 0 2 4 6 8 10 12 05 10 15 20 25 30 0 1 2 3 4 5 6 7 8 9 10 05 10 15 20 25 30 0 2 4 6 8 10 12 14 16 Figure 5. The curve chart of PCNN logarithmic sequence of original image and its noise images which have been adding salt & pepper noise 图5. 原图及其加入椒盐噪声后的 PCNN 对数序列曲线图 Table 3. Comparison of noisy figure recognition 表3. 加噪图像识别比较 加噪程度 1% 2% 3% 4% 5%: 识别正确率 100% 100% 100% 30% 20% 从表 3中可以看出,当分别加入 1%、2%、3%的 椒盐噪声时,可以很好的识别人脸朝向,当加入大于 等于 4%的椒盐噪声后,识别率明显下降。因此可以 得出该方法在一定椒盐噪声范围内可以有效识别图 像。 4. 结束语 本研究基于脉冲耦合神经网络(PCNN),研究分析 4种特征提取方法,实现了多角度快速、有效地提取 人脸朝向特征,很好地完成了多维信息到一维信息的 转化,极大地削减了运算量和数据存储。通过与欧氏 距离法相结合,对人脸朝向进行了比较识别。实验表 明,这4种基于 PCNN特征序列的特征提取方法是有 效的、可行的,其中基于PCNN对数序列的特征提取 方法在人脸朝向识别中的效果是最好的,可以利用其 进行人脸朝向特征提取;通过对有噪图像的识别可以 得出,一定范围的椒盐噪声对图像的 PCNN对数序列 的影响很小,其具有特定的抗噪性能。 5. 致谢 衷心感谢河北省高等学校自然科学研究青年基金 对本课题研究的大力支持,感谢河北工业大学王霞教 授在百忙之中阅读此文,同时感谢王蒙军老师对本课 题的指导。 参考文献 (References) [1] 朱玉华, 段晓东, 刘宏. 一种基于特征三角形的驾驶员头部 朝向分析方法[A]. 中国人工智能学会第 13届全国学术年会, 2010-8. [2] 王丽婷, 丁晓青, 方驰. 一种鲁棒的全自动人脸特征点定位 方法[J]. 自动化学报, 2009, 35(1): 9-16. [3] R. Eckhom, H. J. Reitboeck, M. Amdt, et al. A Neural networl for feature linking via synchronous activity: Results from cat visual cortex and from simulations. In: R. M. J. Cotterilled Ed., Modets of brain function. Cambridge: Cambridge University Press, 255-272. [4] J. L. Johnson. Pulse-coupled neural nets: Translation, rotation, scale, distortion, and intensity signal invariance for image. Ap- plied Optics, 1994, 33(2 6): 6239-6253. 李媛 等基于脉冲耦合神经网络的人脸朝向分析 86 | J. L. Johnson, M. L. Padgett. PCNN models and applications. IEEE Transaction on Neural Net wor ks, 1999, 10(3): 480-498. [6] 马义德, 李廉, 绽琨等. 脉冲耦合神经网络与数字图像处理 [M]. 北京: 科学出版社, 2006: 225-254. [7] J. L. Johnson. Pulse-coupled neural networks. Orlando: Adaptive Computing: Mathematics, Electronics and Optics, Proceeding of a Conference, 1994, 4: CR55. [8] 马义德, 袁敏, 齐春亮等. 基于脉冲耦合神经网络(PCNN) 的 语谱图特征提取在说话人识别中的应用[J]. 计算 机工程与 应 用, 2005, 41(20): 81-84. [9] 马义德, 吴承虎. 基于 PCNN 脉冲耦合神经网络的有噪图像 特征提取[A]. 第十二届全国神经计算学术大会论文集[C], 2002: 661- 668. [5] Copyright © 2011 Hanspub CSA |