Hans Journal of Data Mining
Vol. 10  No. 04 ( 2020 ), Article ID: 37861 , 7 pages
10.12677/HJDM.2020.104026

GRNN神经网络在粮食产量预测中的应用

薛培

天津工业大学,电气工程与自动化学院,天津

收稿日期:2020年9月5日;录用日期:2020年9月20日;发布日期:2020年9月27日

摘要

我国作为一个粮食种植大国,对粮食产量预测问题进行研究尤为重要。尽管我国的粮食产量每年都在稳定增长,但影响粮食产量变化的因素依然存在,例如:粮食播种面积、有效灌溉面积、受灾面积、农用化肥施用折纯量和从业人数等等,具有极其复杂的非线性关系。为了提高粮食产量的预测精度,通过BP神经网络和GRNN (广义回归神经网络)两种方法对比,并根据影响预测粮食产量变化的五种因素,分析神经网络模型、学习方法和网络结构等,对神经网络的参数进行优化,建立粮食产量的预测模型来精确预测粮食产量。本文在国家统计局统计1995~2019年全国粮食总产量及影响因素等数据基础上,建立BP神经网络与GRNN的仿真模型。预测结果表明:相对于BP神经网络,GRNN预测精度更高,速度更快,模型更稳定,可以很好地用于粮食生产预测。

关键词

粮食产量,预测,BP神经网络,广义回归神经网络

Application of GRNN Neural Network in Grain Yield Prediction

Pei Xue

College of Electrical Engineering and Automation, Tiangong University, Tianjin

Received: Sep. 5th, 2020; accepted: Sep. 20th, 2020; published: Sep. 27th, 2020

ABSTRACT

As a large country of grain cultivation, it is very important to study the problem of grain yield prediction in China. Although our country’s grain production is increasing steadily every year, the factors affecting the change of grain production still exist, such as: grain planting area, effective irrigation area, affected area, fertilizer application amount and number of employees, etc., which have extremely complex nonlinear relationship. To improve the prediction accuracy of grain yield, the BP neural network and GRNN (generalized regression neural network) were compared, and the neural network model, learning method and network structure were analyzed according to the five factors affecting the prediction of grain yield. By optimizing the parameters of the network, the prediction model of grain yield is established to accurately predict grain yield. This paper establishes a simulation model of BP neural network and GRNN based on the statistics of the National Bureau of Statistics 1995~2019. The prediction results show that compared with the BP neural network, the GRNN prediction accuracy is higher, the speed is faster, and the model is more stable, which can be well used in the prediction of grain production.

Keywords:Grain Yield, Prediction, BP Neural Network, GRNN

Copyright © 2020 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

在如今社会的高速发展中,每个人都与粮食有着不可分割的联系,同时粮食对于我国社会稳定、经济发展具有重要作用,所以准确地预测出粮食产量,为政府提供科学的数据依据,也是整个国家安全系统的重要一部分,同样关系着国民经济的发展。而对于粮食来说,预测产量避免出现市场供应不足等现象则尤为重要。而我国的一些研究学者对粮食产量预测有了一定的成果,例如邓聚龙提出了灰色系统理论模型 [1];苏涛等人研究了遥感预测法 [2];高倩倩等人对回归分析法进行了深入研究 [3];郑勇等人提出了LSTM神经网络的多维时间预测方法 [4],避免了梯度消失问题,预测效果好。

在农业生产中,影响粮食产量包含各种因素,其中影响较大的五种因素为粮食播种面积、有效灌溉面积、受灾面积、农用化肥施用折纯量和从业人数。本文依据国家统计局所统计的近25年的数据来进行实验设计与分析,进一步研究BP神经网络与GRNN神经网络,并建立产量预测模型。

2. 神经网络

2.1. 神经网络概述

神经网络系统是运用现代的工程科学技术来模拟人类大脑的神经结构和原理,由人工造就的一种类似神经元的多输入单输出的非线性处理信息的网络系统,也称为人工神经网络系统(Artificial Neural Network, ANN) [5]。神经网络基本上不依赖于模型控制方法,它具有较强的自适应能力、学习能力和非线性映射能力,可以根据外界的数据来优化网络构成,因此广泛用于模式识别、函数逼近、经济预测等领域。

2.2. BP神经网络

关于神经网络的结构,一般是按照其连接方式来分类 [6]:一是层状,二是网状,它们之间的区别主要看是否可以双向联系。BP神经网络最大的优点是可以通过自身的学习算法,调整权系数,找到一个最优预测规律下,使其具有逼近任意非线性函数的能力。

Rumelhart等人提出误差反向传递学习算法 [7],即BP算法,因其包含三层网络结构,一般称为三层前馈网,如图1所示。在正向传递过程中,输入信息从输入层经过隐含层进行逐层处理,最后传向输出层。如果输出层得到的输出值不是所期望的,则进行反向传递,将误差信号沿原通道返回,通过修正各层神经元的权值,尽可能的消除误差信号。

Figure 1. BP neural network architecture

图1. BP神经网络结构

2.3. GRNN神经网络

广义回归神经网络(GRNN, Generalized Regression Neural Network) [8] 是建立在数理统计基础上的径向基函数网络,其理论基础是非线性回归分析。与BP神经网络相比的区别在于,GRNN是利用激活神经元来逼近函数。广义回归神经网络具有很强的非线性映射能力和学习速度,在逼近函数方面有很强的优势,同时还具有一定的容错量和鲁棒性,样本数据较少时,预测效果很好,适用于处理不稳定的数据。GRNN在结构上由四层结构构成,分别为输入层、模式层、求和层和输出层,网络结构如图2所示。

Figure 2. GRNN neural network structure

图2. GRNN神经网络结构

输入层神经元的数目等于学习样本中输入向量的维数,直接将输入变量传递给模式层,模式层的神经元数目等于学习样本的数目n,求和层中使用两种类型神经元进行求和,输出层中的神经元数目等于学习样本中输出向量的维数k,各神经元将求和层的输出相除,经过j的输出对应估计结果Y(x)的第j个元素。

1) 输入层

输入层的主要作用是将影响粮食产量预测的五个主要因素的数据直接传递到模式层,输入层的神经元个数即为样本数据的维数,其结构是神经元并行排列。

2) 模式层

模式层神经元的传递函数为:

p i = exp [ ( X X i ) T ( X X i ) 2 σ 2 ] (1)

式中,X为输入的模型样本,Xi代表第i个神经元对应的训练样本,σ为高斯函数的宽带系数,在这里代表函数的平滑因子,P为随机变量x的维度。

3) 求和层

求和层一般有两种形式进行求和,一种的计算公式为:

n exp [ ( X X i ) T ( X X i ) 2 σ 2 ] (2)

另一种求和公式为:

n Y i exp [ ( X X i ) T ( X X i ) 2 σ 2 ] (3)

求和层的第i个神经元与求和层第j个神经元对应的加权系数是第i个样本输入向量Y(i)的第j个因子。其激活函数公式为:

S N j = i = 1 n y i j P i j = 1 , 2 , , k (4)

4) 输出层

输出层节点的个数和粮食产量预测样本数据的输出数据集的维数k是相同的,Y(x)代表输出层的第j个元素的输出是由各个神经元除去求和层对应的第j个神经元的输出值求得,公式如下:

y i = S N j S D j = 1 , 2 , , k (5)

3. 粮食产量预测模型建立

3.1. 数据收集和数据归一化处理

在进行实验之前,先进行数据收集,本文中影响粮食产量预测的五种因素的近25年的具体数据通过查询国家统计局得出,包括粮食播种面积(千公顷) X1、有效灌溉面积(千公顷) X2、受灾面积(千公顷) X3、农用化肥施用折纯量(万吨) X4和从业人数(万人) X5。将粮食产量(万吨) Y作为神经网络模型的输出。实验中将1995~2014年粮食产量数据作为训练样本,分别训练BP神经网络和GRNN神经网络,得到相对准确的模型,再应用训练好的模型预测2015~2019年的粮食产量,由国家统计局得出近五年的五种影响参数和粮食产量如表1所示,并与实际产量对比,观察两个神经网络的预测结果。

数据的归一化 [9] 是神经网络预测前对数据进行处理的一种常用方法,通常将所有数据转化为[0,1]之间的数,目的是消除掉各维数间数量级的差别,避免因为输入层数量级差别较大影响神经网络预测结果的准确性。归一化方法采用的函数形式为:

x k = ( x k x min ) / ( x max x min ) (6)

Table 1. Model test set for grain production prediction

表1. 粮食产量预测模型测试集

3.2. BP神经网络模型建立

BP神经网络模型通过三层网络结构对1995~2014年的粮食产量样本进行训练,输入层x和输出层y的节点数都为1,根据公式:

q = x + y + a (7)

确定隐含层的节点数q为5,式中:a为10以内的整数。学习率参数为0.01,训练次数10,000,训练目标为0.001,动量系数初始值在[0, 1]区间上选取随机数。

3.3. GRNN神经网络模型建立

相比于BP神经网络,GRNN神经网络具有需要确定的参数较少,网络对样本数目要求不高的优势,其中扩展速度spread参数对模型的性能影响相对较大。扩展速度越小,函数的线性逼近能力越强,但是数值过小的话,会出现函数逼近曲线不平滑的现象,所以扩展速度的选取必须要合理。

为了寻找最适合粮食产量预测的GRNN神经网络,选择交叉验证的划分方法不断训练得到最优的扩展速度。需要把总体样本量分为k个模块,其中一个模块单独作为验证样本,该模块用于训练样本集,重复交叉验证每个衍生小样本,k次的结果进行平均求值,最终得到一个估测值。每次训练样本和随机产生的子样本不断循环训练且每一次得到的结果都会再验证一遍。经过试验对比,选取扩展速度spread为0.1时训练数据的预测效果良好。

4. 仿真实验与结果分析

仿真实验中,通过MATLAB软件 [10] 进行编程实现BP神经网络预测和GRNN神经网络预测模型的建立并进行仿真实验研究。实验中将1995~2014年粮食产量数据作为训练样本,进行神经网络模型的自我学习能力。

Figure 3. BP neural network training sample results

图3. BP神经网络训练样本结果

Figure 4. GRNN training sample results

图4. GRNN训练样本结果

BP神经网络训练样本结果如图3所示,可以看出训练模型的结果与实际粮食产量有一定的偏差。图4为GRNN神经网络训练样本的结果。通过两种神经网络训练结果中可以看出,GRNN预测基本吻合实际值,强于BP神经网络对训练样本数据的预测能力。

分别用训练好的BP神经网络模型和GRNN神经网络模型对2015~2019年的近五年粮食产量进行预测,两种模型的测试样本结果对比如图5所示。

Figure 5. Comparison of BP and GRNN test sample results

图5. BP与GRNN测试样本结果对比

图5可知,GRNN神经网络模型的预测粮食产量能力较好,预测值与实际值偏差较小,相比于BP神经网络的预测值更趋向于粮食产量的实际值,对粮食产量预测更加精确。

5. 结语

本篇文章为了研究更加精确预测粮食产量的问题,通过建立BP神经网络和GRNN神经网络模型进行研究,在仿真实验结果中发现GRNN具有更加精准的预测能力。因其具有精度高、误差小和所需样本数目要求不高等优点,可以很好地在实际应用中用于粮食产量预测。这对提高粮食产量的预测能力,保证粮食稳定有一定的参考意义。

文章引用

薛培. GRNN神经网络在粮食产量预测中的应用
Application of GRNN Neural Network in Grain Yield Prediction[J]. 数据挖掘, 2020, 10(04): 247-253. https://doi.org/10.12677/HJDM.2020.104026

参考文献

  1. 1. 邓聚龙. 粮食的灰色模糊预测与控制[J]. 华中工学院学报, 1983(2): 1-8.

  2. 2. 苏涛, 冯绍元, 徐英. 基于光能利用效率和多时相遥感的春玉米估产模型[J]. 遥感技术与应用, 2013, 28(5): 824-830.

  3. 3. 高倩倩, 邢秀凤, 姚传进. 基于逐步回归分析的粮食产量影响因素研究[J]. 当代经济, 2010(9): 145-147.

  4. 4. 郑勇, 任万明, 等. 基于LSTM神经网络的粮食总产量多维时间序列预测方法[P]. 中国专利, CN109002917A. 2018-12-14.

  5. 5. Jo, S., Ma, B.C. and Kim, Y.C. (2020) Artificial Neural Network for Combined Steam-Carbon Dioxide Reforming of Methane. Journal of Nanoscience and Nanotechnology, 20, 5730-5733. https://doi.org/10.1166/jnn.2020.17634

  6. 6. 张卓然. BP神经网络和自适应模糊推理系统在多传感器粮情信息融合系统中的研究及应用[D]: [硕士学位论文]. 武汉: 武汉工业学院, 2012.

  7. 7. 孙艳. 基于改进强化学习算法的神经模糊控制器的设计与实现[D]: [硕士学位论文]. 济南: 山东大学, 2007.

  8. 8. Cai, Y., Huang, Q., Lin, Z., Xu, J., Chen, Z. and Li, Q. (2020) Recurrent Neural Network with Pooling Operation and Attention Mechanism for Sentiment Analysis: A Multi-Task Learning Approach. Knowledge-Based Systems, 203, Article ID: 105856. https://doi.org/10.1016/j.knosys.2020.105856

  9. 9. 王岩. 深度神经网络的归一化技术研究[D]: [硕士学位论文]. 南京: 南京邮电大学, 2019.

  10. 10. 刘金坤. 先进PID控制及其MATLAB仿真[M]. 北京: 电子工业出版社, 2003: 102-106.

期刊菜单