Computer Science and Application 计算机科学与应用, 2012, 2, 57-60 http://dx.doi.org/10.12677/csa.2012.22011 Published Online June 2012 (http://www.hanspub.org/journal/csa) A Recognition Model of Hand Odor Based on BP Artificial Network* Chengsheng Long, Xin Wang, Dehua Wu#, Huidong Zhang, Zhenhua Song Nanjing Police Dog Research Institute of Public Security Ministry, Nanjing Email: {longchengsheng, #jqswdh}@163.com Received: Jan. 18th, 2012; revised: Feb. 25th, 2012; accepted: Mar. 9th, 2012 Abstract: A recognition model has been developed based on Back Propagation Artificial Network and its net parame- ters were optimized. Hand odors were sampled, concentrated and then analyzed with Chromatography-Mass Spec- trometer, resulting in hand odor profiles whose feature variables (47 organic compounds) were extracted and reduced by means of stepwise discriminant analysis. In sequence, a BP network, in which the structure was 47 × 10 × 1, the transfer functions for hidden layer and output layer tansig and logsig, respectively, and the training function trainrp, was pro- posed. The experiment demonstrated that the network was able to specify whether an odor sample had been from man hand or woman hand. Keywords: Hand Odor; Pattern Recognition; BP Network 基于 BP 网络的手部气味识别* 龙成生,王 辛,吴德华#,张汇东,宋珍华 南京警犬研究所,南京 Email: {longchengsheng, #jqswdh}@163.com 收稿日期:2012 年1月18 日;修回日期:2012 年2月25 日;录用日期:2012 年3月9日 摘 要:本文建立了一个基于BP 人工神经网络的手部气味识别模型,并对网络参数进行了选择优化。人体手 部气味经样品采集、浓缩后,用气相色谱–质谱联用仪对其进行分析获得手部气味轮廓图,并利用逐步判别分 析法提取了手部气味轮廓图的 47 个特征变量(有机化合物)。在此基础上,构建了一个 47 × 10 × 1的BP 网络, 其隐含层和输出层的传递函数分别为 tansig 和logsig,训练函数为 trainrp。该网络能正确区分不同性别的手部 气味。 关键词:手部气味;模式识别;BP 网络 1. 引言 人体气味同指纹一样具有个体特征性,能用于个 体识别[1,2]。同时,人体气味在人的社会交际中起着巨 大作用[3]。目前,大部分研究主要是针对人体气味的 化学组成、产生机理和可能的生物功能进行的[2,4]。让 人遗憾的是,人体气味中有生物功能的化学物质至今 仍不清楚。然而,训练好的犬能够区别不同人的气味 [5]。警犬气味鉴别是警犬技术的重要组成部分,能快 速准确锁定犯罪嫌疑人。人体气味的个体特征性是警 犬气味鉴别的基础,手部气味是警犬气味鉴别特别关 注的一类人体气味[6,7]。 BP 网络是人工神经网络中应用最广 泛的一 种神 经网络[8]。在人工神经网络的实际应用,80%~90%的 人工神经网络模型都是采用 BP 网络或它的变化形 *资助信息:公安部应用创新项目(2011YYCXNJJQ164)。 #通信作者。 Copyright © 2012 Hanspub 57 基于 BP 网络的手部气味识别 式。如今,BP 网络在模式识别[9]、图像处理及分析[10]、 控制[11]等领域均有广泛的应用。 为了探索人体手部气味是否具有区分性别的功能, 本文利用气相色谱–质谱联用技术(Chrom at ography- Mass Spectrometer, GC-MS)对手部气味进行了定性定 量分析,以图谱数据为基础,建立了基于 BP 神经网络 的手部气味识别模型。 2. 手部气味数字化及特征向量提取 手部气味样品利用气相色谱质谱联用技术进行 分析[12]。样品分析完成后,对总离子流图上的色谱峰 进行识别和积分(这由分析仪器所配的工作站 Agilent Chemstation Software 增强版(Windows XP)完成),提 取积分结果中的保留时间及其对应的峰面积,并将提 取的信息导入Excel 表。导入 Excel 表后的数据形式 为:数据按保留时间升序排列,每个样品占两列,第 一列为保留时间,第二列为峰面积,同一行的峰具有 相等的保留时间(差值小于0.05);如果样品中上不存 在某一保留时间的峰,则将其峰面积设为 0。数据整 理完成后,将各峰的面积与该样品中所有峰面积的总 和相除,得到各个峰的相对丰度(最高丰度设为 1000), 后续的计算均基于相对丰度进行。 经过上述数据预处理后,变量集由 135 个色谱峰 组成,即变量集含有 135 个变量。之后,我们利用逐 步差别分析法[13]提取了特征变量,特征变量集由47 个色谱峰组成。图 1为手部气味数字化及特征向量提 取过程的流程图。 3. BP网络的构建及优化 本研究组建的网络为一单隐含层BP 网络。此网 络结构为 47 × H × 1,即输入层节点数为47(特征变量 的数目)、隐含层节点数为H、输出层节点数为1,如 图2所示。 网络建立后,我们优化了隐含层节点数和各层之 间的传递函数,比较了不同训练函数对该网络的影 响,网络参数取值范围如表 1所示。同时,我们也对 该网络的初始权值和初始阈值进行了设定。特征变量 协方差矩阵的前 H行(H为隐含层的节点数)为输入层 与隐含层之间权值矩阵 IW{1,1}的初始值,其主对角 线为隐含层与输出层之间权值矩阵 LW{2,1}的初始 值;初始阈值均设为 0。 训练集由 40个手部气味样品组成,男女各 20个; 手部气味分析 气 味 样 品 原始色谱图 积分参数图 变量提取图 时间 时间 相对丰度 丰度 丰度 时间 Figure 1. Odor digitalization and feature variable extraction 图1. 手部气味数字化及特征向量提取过程示意图 1 2 47 1 2 H 1 输入层 隐含层 输出层 Figure 2. BP network structure 图2. BP网络结构 Table 1. Network parameters 表1. BP网络设计参数取值范围 参数 取值范围 输入层节点数 47 输出层节点数 1 隐含层层数 1 隐含层节点数 H∈[7, 17] 传递函数 tansig, logsig , purelin 训练函数 trainlm, trainscg, trainrp Copyright © 2012 Hanspub 58 基于 BP 网络的手部气味识别 测试集由 9个手部气味样品组成,其中男性占 4个。 采用批序模式(batch model)对网络进行训练。所有实 验均基于 Matlab (Version 7.0.0.19920(R14))神经网络 工具箱进行。 此BP 网络的主要 Matlab 的代码如下: 1) 参数设置 P(47 × 40)为训练集,T(1 × 40)为目标向量(0 代表 男性,1代表女性),f_com 为特征变量的协方差矩阵 (47 × 47),test_P(47 × 9)为测试集,TF_1和TF_2分 别为隐含层和输出层的传递函数,TrF 为训练函数, 隐含层结点数 NodeNum = H,输出结点数 OutNum = 1,最大训练次数 TrainEpochs = 10000。 2) BP网络的生成 net=newff(minmax(P),[NodeNum, OutNum],… {TF_1,TF_2 },TrF); 3) 初始权值和阈值设定 s_com= f_com(1:NodeNum, :); com_diag = diag(s_com); net.IW{1,1} = s_com; net.LW{2,1}= com_diag(fin d (com_diag))'; net.b{1} = zeros(NodeNum,1); net.b{2} = 0; 4) 网络的训练及测试 net.trainParam.goal = 1e–20; net.trainParam.min_grad = 1e–20; net.trainParam.epochs = TrainEpochs; [net,tr] = train(net, P, T); test_result = sim(net, test_P). 4. 结果与讨论 4.1. 优化结果与讨论 1) 确定隐含层节点数。在讨论隐含层节点数对网 络性能的影响过程中,隐含层的传递函数设为 “logsig”,输出层的传递函数也为“purelin”,训 练 函 数为“trainscg”,网络性能函数为“mse”。实验结果 如表 2所示。从表2中数据可以看出,隐含层节点 NodeNum = 10时网络性能最好。 2) 选择传递函数。在考察传递函数对网络性能的 影响时,隐含层的节点数选为 10,训练函数为 “trainscg”。一般情况下,第一层的传递函数为非线性 函数。因此我们将tansig,logsig,purelin 函数进行分 组比较,组合情况如表 3所示。表4为网络优化结果, 数据表明隐含层和输出层的传递函数分别为 tansig 和 logsig 时,网络性能最好。 3) 选择训练函数。在隐含层节点数为10,隐含 层和输出层的传递函数分别为tansig和logsig条件下, 我们考察了三个训练函数 trainlm,trainscg,trainrp 对网络性能的影响。实验结果如图 3所示。当误差阈 值设为 10–20 时,用 trainlm 函数训练网络,其速度要 快于 trainscg函数,但比 trainrp 函数速度慢。当误差 阈值设为 10–50 时,trainlm和trainscg两个函数均无法 到目标,但是 trainrp 仍具有非常好的性能。 达 Table 2. Results of optimization with various hidden nodes 表2. 不同隐含层节点数的优化结果 节点数(NodeNum) 7 8 9 10 11 12 13 14 15 16 17 训练次数 3404 3033 3242 2731 3022 3413 3240 4012 3534 3846 3168 网络误差(MSE) × 10–21 9.971 9.989 9.773 8.080 9.982 9.069 8.837 9.968 9.738 9.218 9.947 Table 3. Transfer function groups 表3. 不同传递函数的组合情况 组合序号 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ 隐含层传递函数 tansig tansig tansig logsig logsig logsig 输出层传递函数 tansig logsig purelin tansig logsig purelin Table 4. Results of optimiz ation with different transfer functions 表4. 不同传递函数优化结果 组合序号 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ 训练次数 10,000 619 2724 10,000 654 2731 网络误差(MSE) 4.6701e–009 9.6488e–021 9.9106e–021 5.6499e–009 9.6429e–021 8.0797e–021 Copyright © 2012 Hanspub 59 基于 BP 网络的手部气味识别 0100 200300 400500 600 700 80090010001100 10 -60 10 -50 10 -40 10 -30 10 -20 10 -10 10 0 MSE trainlm trainscg trainrp Figure 3. Optimation results of different training functions 图3. 不同训练函数优化结果 从图 3可以看出,trainlm 和trainscg 曲线的误差 最后趋向于一个极限值,无法达到设定的误差阈值。 说明这两个训练函数在此应用中有一定限制,无法达 到应用要求。 综上所述,优化后的网络参数为:隐含层节点数 H = 10,隐含层传递函数为 tansig,输出层传递函数 为logsig,训练函数为 trainrp。 4.2. 训练及测试结果 利用样本数为 40 的训练集对 4.1 中优化好的 BP 网络进行了训练,并用另外 9个样品对训练好的网络 进行了测试,结果如表5所示。表中第 i行第j列的 数值表示类别i的样品被归类为类别j的百分数。例 如,第 1行第 1列的数值 100 表示训练集中女性样品 被归类为女性样品的百分比为 100%,即正确率为 100%。 Table 5. Results of the training and test for BP network 表5. BP网络训练及测试结果 训练集样本(O) 测试集样本(O) 女性(%) 男性(%) 女性(%) 男性(%) 女性(T) 100 0 100 0 男性(T) 0 100 0 100 5. 结论 人体手部气味经样品采集、仪器分析、特征变量 提取后,被转化为可视的手部气味轮廓图。本文利用 BP 人工神经网络实现了人体气味轮廓图的识别, 即 能够区分不同性别的手部气味轮廓图,此网络对训练 集和测试的识别正确率为 100%。在实际应用过程中, 此方法可与气味鉴别犬相结合,缩小目标气味的范 围,达到快速破案的目的。当然,为了更好地融合仪 器分析技术与警犬技术,我们还有大量的工作需要 做。例如,开发适合分析人体手部气味的仪器分析技 术;进一步探索人体手部气味的数字化方法等等。 参考文献 (References) [1] D. J. Penn, E. Oberzaucher, K. Grammer, et al. Individual and gender fingerprints in human body odour. Journal of the Royal Society Interface, 2007, 4(13): 331-340. [2] A. P. Kelly, D. P. Wood. Handbook of hydrocarbon and lipid microbiology. Berlin: Springer, 2010: 3204-3213. [3] A. Weller. Human pheromones. Communication through body odour. Nature, 1998, 392(6672): 126-127. [4] G. Preti, J. J. Leyden. Genetic influences on human body odor: From genes to the axillae. Journal of Investigative Dermatology, 2010, 130(2): 344-346. [5] 吴德华, 王辛. 警犬鉴别人体气味的发展历程[J]. 警犬, 2004, 4: 50-51. [6] A. M. Curran, P. A. Prada and K. G. Furton. The differentiation of the volatile organic signatures of individuals through SPME- GC/MS of characteristic human scent compounds. Journal of Forensic Sciences, 2010, 55(1): 50-57. [7] A. M. Curran, C. F. Ramirez, A. A. Schoon, et al. The frequency of occurrence and discriminatory power of compounds found in human scent across a population determined by SPME-GC/MS. Journal of Chromatography B, 2007, 846(1-2): 86-97. [8] 傅荟璇, 赵红. MATLAB神经网络应用设计[M]. 北京: 机械 工业出版社, 2010: 83-97. [9] 陈学峰, 赵质良, 王金光. 基于 BP 神经网络的齿轮箱故障模 式识别[J]. 装备制造技术, 2010, 10: 16, 27. [10] Y. D. Zhang, Z. C. Dong, L. N. Wu, et al. A hybrid method for MRI brain image classification. Expert Systems with Applica- tions, 2011, 38(8): 10049-10053. [11] 刘召彤, 李艳萍, 杜光月. 基于 BP 网络的人体穴位分布模型 设计[J]. 信息技术与信息化, 2011, 1: 35-37. [12] M. Kusano, E. Mendez and K. G. Furton. Development of head- space SPME method for analysis of volatile organic compounds present in human biological specimens. Analytical and Bioana- lytical Chemistry, 2011, 400(7): 1817-1826. [13] 龙成生, 王辛, 吴德华等. 基于逐步判别分析的血迹气味识 别[J]. 数据挖掘, 2012, 2: 1-5. Copyright © 2012 Hanspub 60 |