物联网在农业中的应用,使一系列作物在不同生长周期被模糊处理的问题,都得到了良好把关。然而这种精确把关,从某种程度上讲也是远程控制技术人员经验,感觉的反映。本文基于农作物生长优选环境的选择,对面向农业物联网监测到的数据,采用统计中的方差分析方法构建模型,将统计方法与农业问题的解决相结合,进而准确定量的寻找作物生长的最佳试验点,保证农作物有一个良好适宜的生长环境,并试图将这种方法应用于实践中。 The application of the Internet of things in agriculture has made a series of crops problems in dif-ferent growth periods be well controlled. However, the precise control, to some extent, is also the reflection of experience and feeling from technicists who take charge in the remote control tech-nology. This article based on the choice of crops growth optimizing environment, monitoring date from the agriculture network and construction of model by statistical method of ANOVA, combines statistical method with agriculture problem in order to accurately and quantificationally discover the best sites for crop growth and ensure that crops have a suitable growth environment and even-tually put this method into practice.
陈建杰1,牟唯嫣1,朱华吉2
1北京建筑大学理学院,北京
2北京农业信息技术研究中心,北京
收稿日期:2015年12月10日;录用日期:2015年12月27日;发布日期:2015年12月30日
物联网在农业中的应用,使一系列作物在不同生长周期被模糊处理的问题,都得到了良好把关。然而这种精确把关,从某种程度上讲也是远程控制技术人员经验,感觉的反映。本文基于农作物生长优选环境的选择,对面向农业物联网监测到的数据,采用统计中的方差分析方法构建模型,将统计方法与农业问题的解决相结合,进而准确定量的寻找作物生长的最佳试验点,保证农作物有一个良好适宜的生长环境,并试图将这种方法应用于实践中。
关键词 :农业物联网,监测数据,优选环境,方差分析,最佳试验点
物联网被世界公认为是继计算机,互联网与移动网之后的世界信息产业第三次浪潮。与传统的农业相比,浇水,施肥,打药全凭经验,靠感觉,而农业物联网技术的应用,瓜果蔬菜该不该浇水?施肥,打药怎样保持精确的浓度?温度,湿度如何实现按需分配?农民只需按个开关,做个选择,或是完全听“指令”,就可以种好菜,养好花。然而农业物联网的这种“精确”把关,从某种程度上讲,也是远程控制技术人员经验,感觉的反映[
多元统计分析中的方差分析模型是20世纪发展起来的一种统计方法,它是由英国统计学家进行试验设计时为解释试验数据而首先引入的 [
在一次基于物联网监测数据的农业试验中,研究影响玉米产量的因子,试验中选用了三个玉米品种,分别施用三种肥料,然后在面积和肥沃程度基本相同的土地上进行试验。试验结果见表1。在误差允许的范围内,控制其它生长环境几乎理想的情况下,采用交互分组和二种因素配合进行试验 [
品种1 | 品种2 | 品种3 | |
---|---|---|---|
肥料1 | 26 24 27 25 25 | 19 20 23 22 21 | 19 22 22 21 20 |
肥料2 | 20 17 22 21 17 | 18 17 13 16 12 | 17 14 15 16 15 |
肥料3 | 19 22 21 20 18 | 15 16 17 15 14 | 17 16 16 15 15 |
表1. 不同试验条件下的玉米产量
生长的优选环境即分析影响作物生长的不同因素组合下的产量是否有显著差异,实际上是判断不同的因素组合对农作物的产量是否有显著影响,做出这种判断最终被解释为从误差来源分析入手,寻找造成作物产量的这种差异来源于何种原因。基于北京农业信息技术研究中心监测到的数据统计结果如上,采用简单随机抽样保证了样本的独立性,对数据采用EXCEL进行双机录入保证了数据的准确性,并基于SPSS20.0进行数据的建模分析。
研究中物联网监测到的可测指标为玉米产量,涉及的可控因素有两个,分别为品种和肥料。可控因素各有3个水平,每个水平可以看作一个总体,监测到的数据可以看做从相应总体中抽取的样本。从数据的结构可以看到,每两个因素的交叉处进行了重复试验,因此我们可以设法构建平衡态下有交互作用的双因素方差分析统计模型。假设行控制变量有k个水平,列控制变量有r个水平,每个交叉水平处有p个样本,则在行控制变量的第i个水平和列控制变量的第j个水平下的第m个观测值可表示为
其中
基于统计的方法来处理农业问题本质上是将统计中的数据处理思想应用于农业生产问题的研究中,方差分析的思想是分析数据的误差来源。交叉处进行了重复试验,则试验数据中的总差异中应包含有各个可控因素所引起的独立主效应和随机因素所引起的变异,以及通过各个水平间搭配对试验结果产生交互影响(即各可控因素交互作用所引起的变异)。故研究中我们应考虑品种,肥料这两个可控因素引起的以及随机因素的变异和两个可控因素的交互作用引起的变异 [
根据上述的分析我们做出如下的统计假设:
原假设
肥料和品种的交互作用对玉米产量无显著影响。
若
则总的离差平方和:
行因素离差平方和:
列因素离差平方和:
交互作用离差平方和:
误差平方和:
为了检验行因素的主效应是否显著,构建F检验统计量为:
为了检验列因素的主效应是否显著,构建F检验统计量为:
结果见表2,表3:
基于SPSS20.0进行统计分析,可以得到玉米产量的双因素方差分析结果为
误差来源 | 离差平方和 | 自由度 | 均方 | F值 | p值 |
---|---|---|---|---|---|
行因素 | |||||
列因素 | |||||
交互作用 | |||||
误差 | |||||
总和 |
表2. 平衡态下双因素方差分析数据结构
源 | III 型平方和 | df | 均方 | F | Sig. |
---|---|---|---|---|---|
校正模型 | 496.044a | 8 | 62.006 | 23.951 | 0.000 |
截距 | 15754.756 | 1 | 15754.756 | 6085.528 | 0.000 |
品种 | 187.911 | 2 | 93.956 | 36.292 | 0.000 |
肥料 | 307.378 | 2 | 153.689 | 59.365 | 0.000 |
品种*肥料 | 0.756 | 4 | 0.189 | 0.073 | 0.990 |
误差 | 93.200 | 36 | 2.589 | ||
总计 | 16344.000 | 45 | |||
校正的总计 | 589.244 | 44 |
表3. 主体间效应的检验
aR方 = 0.842 (调整R方 = 0.807)
对于给定的显著性水平
在上面的数据模型分析过程中,行平方和度量了肥料对玉米产量的影响效应,列平方和度量了品种对玉米产量的影响效应,而二个平方和加在一起共同度量了主效应对玉米产量的联合效应,联合效应与
总平方和的比定义为
两个主效应解释了玉米产量差异的84.05%,其它因素(交互效应和残差效应)只解释了15.94%,说明肥料和品种的不同与玉米产量之间有较强的关系 [
分析发现品种和肥料的交互效应没有对玉米的产量产生影响,为了直观的显示该结论,我们进行交互作用的图形分析,结果见图1。
在品种从水平1变化到水平3的过程中,肥料3个水平下的玉米产量基本按照相同的规律变动,各直线在各个水平基本平行,所以品种和肥料之间对玉米的产量无明显的交互影响,和我们数据拟合的结果是一致的 [
基于品种多重比较(表4)和偏差对比(表5)以及箱线图2的结果,可以看到品种1和2,3之间对玉米的产量有显著性的影响效应,且品种1作用下的玉米产量均值最大,总体产量都比较高,是我们重点关注和考察的品种 [
而对肥料的多重比较(表6)以及K矩阵偏差对比(表7)和箱线图3的结果表明,肥料1和2,3之间
图1. 交互作用图形分析
(I) 品种 | (J) 品种 | 均值差值 (I-J) | 标准误差 | Sig. | 95% 置信区间 | |
---|---|---|---|---|---|---|
下限 | 上限 | |||||
品种1 | 品种2 | 4.40* | 0.588 | 0.000 | 3.21 | 5.59 |
品种3 | 4.27* | 0.588 | 0.000 | 3.08 | 5.46 | |
品种2 | 品种1 | −4.40* | 0.588 | 0.000 | −5.59 | −3.21 |
品种3 | −0.13 | 0.588 | 0.822 | −1.32 | 1.06 | |
品种3 | 品种1 | −4.27* | 0.588 | 0.000 | −5.46 | −3.08 |
品种2 | 0.13 | 0.588 | 0.822 | −1.06 | 1.32 |
表4. LSD多重比较(品种)
基于观测到的均值。误差项为均值方(错误) = 2.589。*均值差值在 0.05 级别上较显著
品种偏差对比 | 对比结果(K矩阵) | 因变量 | ||
---|---|---|---|---|
玉米产量 | ||||
级别1和均值 | 对比估算值 | 2.889 | ||
假设值 | 0 | |||
差分(估计–假设) | 2.889 | |||
标准误差 | 0.339 | |||
Sig | 0.000 | |||
差分的95%置信区间 | 下限 | 2.201 | ||
上限 | 3.577 | |||
级别2和均值 | 对比估算值 | −1.511 | ||
假设值 | 0 | |||
差分(估计-假设) | −1.511 | |||
标准误差 | 0.339 | |||
Sig | 0.000 | |||
差分的95%置信区间 | 下限 | −2.199 | ||
上限 | −0.823 | |||
表5. 品种偏差对比
图2. 箱线图(品种)
(I) 肥料 | (J) 肥料 | 均值差值 (I-J) | 标准误差 | Sig. | 95% 置信区间 | |
---|---|---|---|---|---|---|
下限 | 上限 | |||||
肥料1 | 肥料2 | 5.73* | 0.588 | 0.000 | 4.54 | 6.92 |
肥料3 | 5.33* | 0.588 | 0.000 | 4.14 | 6.52 | |
肥料2 | 肥料1 | −5.73* | 0.588 | 0.000 | −6.92 | −4.54 |
肥料3 | −0.40 | 0.588 | 0.500 | −1.59 | 0.79 | |
肥料3 | 肥料1 | −5.33* | 0.588 | 0.000 | −6.52 | −4.14 |
肥料2 | 0.40 | 0.588 | 0.500 | −0.79 | 1.59 |
表6. LSD多个比较(肥料)
基于观测到的均值。误差项为均值方 (错误) = 2.589。*均值差值在0.05级别上较显著。
肥料偏差对比 | 对比结果(K矩阵) | 因变量 | ||
---|---|---|---|---|
玉米产量 | ||||
级别1和均值 | 对比估算值 | 3.689 | ||
假设值 | 0 | |||
差分(估计–假设) | 3.689 | |||
标准误差 | 0.339 | |||
Sig | 0.000 | |||
差分的95%置信区间 | 下限 | 3.001 | ||
上限 | 4.377 | |||
级别2和均值 | 对比估算值 | −2.044 | ||
假设值 | 0 | |||
差分(估计-假设) | −2.044 | |||
标准误差 | 0.339 | |||
Sig | 0.000 | |||
差分的95%置信区间 | 下限 | −2.732 | ||
上限 | −1.356 | |||
表7. 肥料偏差对比
图3. 箱线图(肥料)
对玉米产量有显著的影响,且肥料1作用下玉米的产量总体较高,均值最大,是值得我们研究的肥料品种 [
在面向农业物联网监测数据且基于农作物生长优选环境的试验模型分析中,我们是在收集到的数据服从正态性和方差齐性以及各样本相互独立的前提假设下进行的,多以我们有必要对所做的假设进行验证。由于我们采取简单随机抽样得到样本,故保证了数据的随机性和独立性,即从各个总体中抽取的随机样本是相互独立的[
从以上分析结果可以看到,在所有组中因变量的误差方差满足齐性,且在给定的显著性水平下,检验的p值均大于给定的水平,故满足数据分析的正态性。
方差分析是一种定量处理数据的统计推断分析方法。利用统计的思想和模型,定量处理面向农业物流网监测到的数据,可以从某种程度上解决农作物生长优选环境中一系列被模糊处理的问题,具有一定的应用价值。如何找到适合农作物生长的最优组合环境是农业生产中经常遇到的问题,对此我们将统计
F | df1 | df2 | Sig. |
---|---|---|---|
2.613 | 8 | 36 | 0.023 |
表8. 误差方差等同性的Levene检验a
检验零假设,即在所有组中因变量的误差方差均相等。a设计: 截距 + 品种 + 肥料 + 品种 * 肥料
品种 | Kolmogorov-Smirnova | Shapiro-Wilk | |||||
---|---|---|---|---|---|---|---|
统计量 | df | Sig. | 统计量 | df | Sig. | ||
玉米产量 | 品种1 | 0.121 | 15 | 0.200* | 0.950 | 15 | 0.521 |
品种2 | 0.124 | 15 | 0.200* | 0.971 | 15 | 0.878 | |
品种3 | 0.220 | 15 | 0.049 | 0.865 | 15 | 0.028 |
表9 正态性检验
*这是真实显著水平的下限。aLilliefors显著水平修正
肥料 | Kolmogorov-Smirnova | Shapiro-Wilk | |||||
---|---|---|---|---|---|---|---|
统计量 | df | Sig. | 统计量 | df | Sig. | ||
玉米产量 | 肥料1 | 0.163 | 15 | 0.200* | 0.945 | 15 | 0.454 |
肥料2 | 0.186 | 15 | 0.173 | 0.962 | 15 | 0.732 | |
肥料3 | 0.203 | 15 | 0.098 | 0.900 | 15 | 0.095 |
表10. 正态性检验
*这是真实显著水平的下限。aLilliefors显著水平修正
的方法与农业生产中一些问题的研究相结合,可以更加准确方便的解决需多实际问题 [
北京市委组织部优秀人才培养资助项目(2013D005017000016);北京市教育委员会科技计划面上项目(KM201410016003);北京建筑大学学术创新团队(21221214111);研究生培养–研究生教育–产学研联合培养研究生基地(2014) (31062014001)。
陈建杰,牟唯嫣,朱华吉. 基于农作物生长优选环境的方差分析模型The ANOVA Based on Crop Growth Optimization Environment[J]. 统计学与应用, 2015, 04(04): 296-304. http://dx.doi.org/10.12677/SA.2015.44033