">[6]。因此,
PCNN 模型能更好地模拟生物神经元。
一个 PCNN 神经元由三部分组成[7]:接收部分,
调制部分,脉冲发生器,其基本模型见下图 1
PCNN 模型表达式:

exp 11
ijFijFijkl klij
F
nFnVmYn
 
I(1)
0
1
阈值电压
阶跃函数
调制部分 脉冲产生
1ij
L
V
1
ij
Yn
ij
I
1
ij
F
ij
U
ij
Yn
ij
Figure 1. A PCNN neuron model
1. PCNN神经元模型
exp 11
ijLijLijkl kl
LnLnV wYn

(2)
1
ij ijij
Un FnLn

(3)

 
1, 1
0, 1
ij
ij
ij
Un n
Yn Un n


(4)
exp 11
ijij kl
nnVY


n

(5)
exp 11
ijE ijEkl
EnEnV Yn

(6)
其中,Fij[n]就是第(i,j)个神经元的 n次反馈输入;
Lij[n]为线性连接输入项;Iij 为外部输入刺激信号;Eij[n]
为内部活动项 U能否激发脉冲产生所需的动态门限;
为突触之间连接强度常数;Yij[n]PCNN 脉冲输出。
PCNN用于图像识别时,每个像素对应一个神
经元,每个神经元与邻近的神经元相连接;记下每次
迭代过程中整幅图像中点火的神经元数,这样经过一
定的迭代次数后,就得到了一个反映了待识别图像特
征的序列。它反映了输入图像的灰度分布信息,还反
映了相邻像素之间的相对位置信息,这是其可作为特
征信息的关键所在[8]
2.2. 提取人脸朝向特征
一幅二维灰度图像输入PCNN 模型后,将产生一
系列的脉冲图像输出。由于只有01两种取值,这
些脉冲图像也被称为二值图像。这些二值图像序列包
含有原始图像的大量特征信息,但是它们却并不能作
为原始图像的特征进行分类识别,因为它们的数据量
太大了,这种情况下就需要对这些二值图像序列进行
某种变换以达到减少数据量的目的,并且变换后的数
据还可以作为原始数据的特征。
本研究通过对每次扫描后二值图像的输出分别进
行处理,扫描 30次后,得到一个 30维的序列。我们
把人脸的朝向大致分为左方、左前方、前方、右前方、
右方。本研究的试验样本是相机拍摄的一组学生相片,
每个朝向各拍摄5张,分别对这5个朝向(25 )
行特征提取,然后再另取25张图片作为待识别图片,
用于判别朝向。
本研究分别用4种方法(熵序列、对数序列、时间
序列、标准方差序列)提取人脸朝向特征,通过计算特
征序列与未知人脸朝向序列的欧氏距离[7]来判断人脸
的朝向,再依据各自的准确率来比较4种方法的优劣。
Copyright © 2011 Hanspub CSA
李媛 等基于脉冲耦合神经网络的人脸朝向分析83
|
系列
将一幅二维灰度图像输入PCNN模型后,产生一
的脉冲图像输出,计算PCNN 每一次输出的二值
图像的熵值,这样也就得到了一维的熵序列En[n]
En[n] = Entropy(Y[n])Y[n]PCNN n次输出的二
值图像。根据 Shannon关于熵的定义可知,二值图像
的信息熵可用下式计算:

12
log


1 020
log
H
PP PP P (7)
其中,H(P)为二值图像的信息熵;P1
示出
值图像 Y[n]中有边缘、形状、
纹理
(8)
P
P0分别表
10的概率。
PCNN 迭代输出的二
等几何信息,我们探索应用以下 4种特征提取方
法。4种方法的数学表达式如下:
熵序列:

12
logePP 
对数序列: (9)

22
loge
时间序列:
3,ij
eY
n
标准方差序列:
(10)


2
n
4,ij
eY

即扫描次数;熵
(11)
其中,n为迭代次数,序列是对PCNN
每次迭代输出的的二值图像的熵进行求和;对数序列
是对 PCNN 每次迭代输出的二值图像对数进行求和;
时间序列是对 PCNN 每次迭代输出的二值图像 Y[n]
行求和;
是每次迭代输出的Y[n]的平均值。
具体步骤如下:
(1) 将一组(5)向左方朝向的人脸图像分别通过
PCN
得人脸其他 4个朝向的特征
序列
别求得每张人脸
的特
30 次扫描,得到具有
30
特定人进行人脸朝向分析。本
组实
N扫描,得到 5个特征序列对其求平均,得到此
类朝向的特征序列A
(2) 用同样的方法求
分别用 BCDE来表示;
(3) 另取25个未知朝向人脸,分
征序列,通过计算其与5个朝向的特征序列的欧
氏距离,判断其人脸朝向。
2.3. 实验结果及分析
分别对每幅灰度图像进行
元素的熵序列。
下面我们针对某一
验共拍摄了50张人脸朝向图片。图 2为用于提取
人脸朝向特征的25张人脸灰度图像,图 3为待识别的
另外 25张人脸灰度图像。
Figure 2. Images for feature ext ract
ion
2. 特征提取用图
Figure 3. To-be-recognized imag
得人脸朝向左方的特征熵序列:
.0015 0.0015
11 0.0111
.0046 0.0046
es
3. 待识别图像
A = [0 0 0 0
0.8137 0.8136 0.8136 0.8055 0.8057
0.8057 0.8057 0.8057 0.8057 0.8057
0.8057 0.8158 0.8158 0.9840 0.9843
0.8785 0.9951 0.8568 0.9882 0.9414
0.9253 0.7649 0.8728 0.6902 0.8263]
求得人脸朝向左前方的特征熵序列:
B = [0 0 0 0.01
0.9544 0.9536 0.9536 0.9446 0.9454
0.9454 0.9454 0.9449 0.9449 0.9449
0.9450 0.9454 0.9454 0.9969 0.9970
0.8360 0.9844 0.8284 0.9969 0.8669
0.9938 0.7201 0.9735 0.6598 0.9526]
求得人脸朝向前方的特征熵序列:
C = [0 0 0 0
0.9232 0.9229 0.9229 0.9043 0.9046
0.9046 0.9047 0.9044 0.9044 0.9044
0.9045 0.9207 0.9207 0.9916 0.9953
0.8474 0.9983 0.8159 0.9974 0.8527
0.9718 0.7238 0.9162 0.6804 0.8723]
Copyright © 2011 Hanspub CSA
李媛 等基于脉冲耦合神经网络的人脸朝向分析
84 |
135 0.0135
0.0030 0.0030
2
列的特征提取
方法
的人脸图像加入椒盐噪声进
行研
欧氏 A7
左前 前方 D7
右前 E7
求得人脸朝向右前方的特征熵序列:
D = [0 0 0 0.0
0.9835 0.9829 0.9829 0.9772 0.9778
0.9778 0.9778 0.9774 0.9774 0.9774
0.9775 0.9782 0.9782 0.9897 0.9901
0.8111 0.9590 0.7922 0.9871 0.8406
0.9994 0.7103 0.9899 0.6683 0.9708]
求得人脸朝向右方的特征熵序列:
E = [0 0 0
0.7116 0.7111 0.7111 0.6999 0.7004
0.7004 0.7004 0.7004 0.7004 0.7004
0.7004 0.7089 0.7089 0.9846 0.9831
0.8832 0.9967 0.8999 0.9677 0.9551
0.8849 0.7616 0.8300 0.6638 0.7728]
1为部分实验结果。ABCDE分别代表
5个人脸图像提取出的五个朝向的特征熵序列,
A7B7C7D7E7分别代表另 25 个待识别人脸中
5个人脸图像的特征熵序列,分别计算其与AB
CDE的欧氏距离。从表 1实验结果中可以看出,
只有标号是C7的人脸朝向识别错误(C7应为前方,误
判为左方),对 25 张人脸朝向图像的识别情况进行统
计发现其识别正确率为88%。将另外3种基于 PCNN
的特征提取方法与欧氏距离法相结合统计其识别正确
率如表 2所示,从表 2中可以看出这 4种方法中基于
对数序列的特征提取方法对于人脸朝向的识别情况是
最好的,识别正确率为96%
3. 有噪图像的人脸朝向识别
实验已经证明 4种方法中,对数序
与欧氏距离相结合对于人脸朝向识别的效果是最
好的,选取 20 张可以用此方法正确识别的不同朝向的
人脸,并对其随机加入不同程度的椒盐噪声[9],对加
噪后的图像进行识别。
我们用一幅正面朝向
究分析。加噪图像及其对数序列曲线图如图 5
4中第一行从左向右依次是原图、加入 1%
声后的图像、加入 2%椒盐噪声后的图像;第二
行从左到右一次是加入 3%椒盐噪声后的图像、加入
4%椒盐噪声后的图像、加入 5%椒盐噪声后的图像。
5中第一行从左向右依次是原图的PCNN对数
Table 1. The Euclidean distance for entropy sequence
1. 熵序列的欧氏距离
距离 B7 C7
A0. 0.
0238 0.3085 0.0352 0.4371 0679
B左前 0.1553 0.0006 0.1635 0.0183 0.6330
C前方 0.0665 0.0353 0.0579 0.0792 0.4241
D右前 0.2684 0.0137 0.2717 0.0006 0.8450
E 0.2940 0.8806 0.3059 1.0935 0.0192
Table 2. Comparison of four m et hod recognition accuracy
特征 熵 标准方差序列
2. 四种方法识别正确率比较
序列 对数序列 时间序列
识别正确率 88% 96% 92% 84%
序列曲线图、加入1%椒盐噪声后的图像的 PCNN
在图
像中
20 幅图像的识别情况作一个
统计
数序列曲线图、加入 2%椒盐噪声后的图像的 PCNN
对数序列曲线图;第二行从左到右依次是加入 3%
盐噪声后的图像的PCNN对数序列曲线图、加入4%
椒盐噪声后的图像的PCNN对数序列曲线图、加入5%
椒盐噪声后的图像的PCNN对数序列曲线图。
PCNN对数序列的曲线图中可以看出,当
加入 1%2%3%的椒盐噪声时,曲线图与原图
的对数序列曲线图相比变化不大,可以正确识别;当
加噪为4%时,第五次扫描后的对数值明显变小,对
图像的正确识别已经可以产生影响;当加噪 5%时,
第一次扫描后的对数值变得很大,已经不能很好的反
应原灰度图像的信息。
把加入不同噪声的
,如表3
Figure 4. Original image and its noise images which adding
salt & pepper noise
4. 原图及其加入不同椒盐噪声后的图像
Copyright © 2011 Hanspub CSA
李媛 | 基于脉冲耦合神经网络的人脸朝向分析
Copyright © 2011 Hanspub CSA
85
05 1015 2025 30
0
2
4
6
8
10
12
05 1015 2025 30
0
2
4
6
8
10
12
05 10 1520 25 30
0
2
4
6
8
10
12
05 10 15 20 25 30
0
2
4
6
8
10
12
05 10 15 20 25 30
0
1
2
3
4
5
6
7
8
9
10
05 10 15 20 25 30
0
2
4
6
8
10
12
14
16
Figure 5. The curve chart of PCNN logarithmic sequence of original image and its noise images which have been adding salt & pepper noise
5. 原图及其加入椒盐噪声后的 PCNN 对数序列曲线图
Table 3. Comparison of noisy figure recognition
3. 加噪图像识别比较
加噪程度 1% 2% 3% 4% 5%:
识别正确率 100% 100% 100% 30% 20%
从表 3中可以看出,当分别加入 1%2%3%
椒盐噪声时,可以很好的识别人脸朝向,当加入大于
等于 4%的椒盐噪声后,识别率明显下降。因此可以
得出该方法在一定椒盐噪声范围内可以有效识别图
像。
4. 结束语
本研究基于脉冲耦合神经网络(PCNN),研究分析
4种特征提取方法,实现了多角度快速、有效地提取
人脸朝向特征,很好地完成了多维信息到一维信息的
转化,极大地削减了运算量和数据存储。通过与欧氏
距离法相结合,对人脸朝向进行了比较识别。实验表
明,这4种基于 PCNN特征序列的特征提取方法是有
效的、可行的,其中基于PCNN对数序列的特征提取
方法在人脸朝向识别中的效果是最好的,可以利用其
进行人脸朝向特征提取;通过对有噪图像的识别可以
得出,一定范围的椒盐噪声对图像的 PCNN对数序列
的影响很小,其具有特定的抗噪性能。
5. 致谢
衷心感谢河北省高等学校自然科学研究青年基金
对本课题研究的大力支持,感谢河北工业大学王霞教
授在百忙之中阅读此文,同时感谢王蒙军老师对本课
题的指导。
参考文献 (References)
[1] 朱玉华, 段晓东, 刘宏. 一种基于特征三角形的驾驶员头部
朝向分析方法[A]. 中国人工智能学会第 13届全国学术年会,
2010-8.
[2] 王丽婷, 丁晓青, 方驰. 一种鲁棒的全自动人脸特征点定位
方法[J]. 自动化学报, 2009, 35(1): 9-16.
[3] R. Eckhom, H. J. Reitboeck, M. Amdt, et al. A Neural networl
for feature linking via synchronous activity: Results from cat
visual cortex and from simulations. In: R. M. J. Cotterilled Ed.,
Modets of brain function. Cambridge: Cambridge University Press,
255-272.
[4] J. L. Johnson. Pulse-coupled neural nets: Translation, rotation,
scale, distortion, and intensity signal invariance for image. Ap-
plied Optics, 1994, 33(2 6): 6239-6253.
李媛 等基于脉冲耦合神经网络的人脸朝向分析
86 |
J. L. Johnson, M. L. Padgett. PCNN models and applications.
IEEE Transaction on Neural Net wor ks, 1999, 10(3): 480-498.
[6] 马义德, 李廉, 绽琨等. 脉冲耦合神经网络与数字图像处理
[M]. 北京: 科学出版社, 2006: 225-254.
[7] J. L. Johnson. Pulse-coupled neural networks. Orlando: Adaptive
Computing: Mathematics, Electronics and Optics, Proceeding of
a Conference, 1994, 4: CR55.
[8] 马义德, 袁敏, 齐春亮等. 基于脉冲耦合神经网络(PCNN)
语谱图特征提取在说话人识别中的应用[J]. 计算 机工程与 应
, 2005, 41(20): 81-84.
[9] 马义德, 吴承虎. 基于 PCNN 脉冲耦合神经网络的有噪图像
特征提取[A]. 第十二届全国神经计算学术大会论文集[C],
2002: 661- 668.
[5]
Copyright © 2011 Hanspub CSA