对粮食产量的研究一般采用传统的线性模型,假设方程误差项相互独立,采用最小二乘法进行参数估计。为提高模型的估计精度,引入似乎不相关模型,以1990~2009年稻谷、小麦、玉米的产量、种植面积和有效灌溉面积数据分别建立最小二乘模型和似乎不相关模型。结果显示似乎不相关模型的参数方差一致小于最小二乘模型,用两种模型分别对2010~2015年的三种粮食产量进行预测,似乎不相关模型预测的平均误差更小。说明三种粮食的产量之间存在一定的相关性,似乎不相关模型较传统的最小二乘模型效果更好。 The traditional linear model is usually used in the study of grain yield ,in which the error terms are assumed independent of each other, and the parameters are estimated by the least squares method. In order to improve the estimation accuracy, seemingly unrelated model is introduced. Least squares model and seemingly unrelated model were built with the data that the yield, planting area and irrigation area of rice, wheat and corn between 1990 and 2009. The result showed that parameter variance of seemingly unrelated model is smaller than the least square model. The output of the three kinds of grain between 2010 and 2015 was predicted by the two models, and the average prediction error of seemingly unrelated model was smaller. It shows that there is some correlation between the yields of the three grain crops, and the seemingly unrelated model is better than the traditional least square model.
王博*,张贺
中国地质大学(武汉)数学与物理学院,湖北 武汉
收稿日期:2017年6月18日;录用日期:2017年7月4日;发布日期:2017年7月7日
对粮食产量的研究一般采用传统的线性模型,假设方程误差项相互独立,采用最小二乘法进行参数估计。为提高模型的估计精度,引入似乎不相关模型,以1990~2009年稻谷、小麦、玉米的产量、种植面积和有效灌溉面积数据分别建立最小二乘模型和似乎不相关模型。结果显示似乎不相关模型的参数方差一致小于最小二乘模型,用两种模型分别对2010~2015年的三种粮食产量进行预测,似乎不相关模型预测的平均误差更小。说明三种粮食的产量之间存在一定的相关性,似乎不相关模型较传统的最小二乘模型效果更好。
关键词 :似乎不相关,最小二乘法,粮食产量,参数估计
Copyright © 2017 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
似乎不相关模型最早由Zellner于1962年提出 [
设
对(1)式中的
假定不同误差项之间相互独立,且
(2)式是常见的多元线性模型,也叫线性回归模型 [
此估计量为最优线性无偏估计量。
设
其中,
假设误差项均值为0,不同观测的误差项互不相关,且有相同的方差矩阵,即
其中
则有
模型(6)称为似乎不相关模型 [
则可将(6)写成广义一元线性模型的形式:
其中,“
当方差矩阵
其中
称
粮食产量是关系国家发展的一个重要问题,各个邻域的专家和学者都十分重视对粮食产量问题的研究 [
影响粮食产量的因素主要有粮食种植面积、化肥施用量、受灾面积、农业机械总动力、灌溉面积、人口密度等 [
假设粮食产量与其影响因素满足如下的线性关系:
其中,
其中,
这里
分别计算得到三种农作物的回归方程:
稻谷:
小麦:
玉米:
模型的拟合效果较好。
似乎不相关模型中,参数估计结果为:
由于两种模型中参数
对比表1中两种模型的方差结果,可以发现似乎不相关模型中参数
分别用两种模型对2010~2015年的粮食产量进行预测,结果如表2所示。
结果显示,最小二乘模型中,三种农作物预测产量相对真实值的平均误差分别为4.29%、7.38%、3.28%,而似乎不相关模型的平均相对误差分别为4.08%、5.95%、3.08%,误差分别减小了4.90%、19.38%、6.10%。
本文以粮食产量、种植面积及灌溉面积为变量,分别对稻谷、小麦、玉米建立独立的最小二乘模型和三个方程联立的似乎不相关模型,结果表明似乎不相关模型的参数方差小于最小二乘模型,估计更有效。用两种模型对后续的粮食产量进行预测,似乎不相关模型的平均相对误差整体上小于最小二乘模型,
最小二乘模型 | 似乎不相关模型 | |||||
---|---|---|---|---|---|---|
稻谷 | 0.0056 | 0.0013 | 0.0052 | 0.0012 | ||
小麦 | 0.0043 | 0.0039 | 0.0040 | 0.0037 | ||
玉米 | 0.0101 | 0.0077 | 0.0101 | 0.0077 |
表1. 两种模型参数
时间 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 平均相对误差 | |
---|---|---|---|---|---|---|---|---|
最小二乘模型 | 稻谷 | 20298 | 20775 | 21040 | 21421 | 21690 | 21956 | 4.29% |
小麦 | 12162 | 12671 | 12975 | 13282 | 13664 | 14197 | 7.38% | |
玉米 | 17810 | 18529 | 19635 | 20572 | 21125 | 21809 | 3.28% | |
似乎不相关模型 | 稻谷 | 20270 | 20739 | 21000 | 21374 | 21639 | 21901 | 4.08% |
小麦 | 12016 | 12481 | 12759 | 13040 | 13389 | 13876 | 5.95% | |
玉米 | 17848 | 18567 | 19692 | 20642 | 21194 | 21876 | 3.08% | |
实际值 | 稻谷 | 19,576.10 | 20,100.09 | 20,423.59 | 20,361.22 | 20,650.74 | 20,822.52 | |
小麦 | 11,518.08 | 11,740.09 | 12,102.36 | 12,192.64 | 12,620.84 | 13,018.52 | ||
玉米 | 17,724.51 | 19,278.11 | 20,561.41 | 21,848.90 | 21,564.63 | 22,463.16 |
表2. 两种模型预测结果(单位:万吨)
说明前者的预测精度更高。总体来说,由于似乎不相关模型考虑了方程误差项间的相关性,参数估计的效果比最小二乘模型更好,模型优于传统的最小二乘模型。
王博,张贺. 似乎不相关模型在粮食产量研究中的应用Application of Seemingly Unrelated Model in the Study of Food Production[J]. 应用数学进展, 2017, 06(04): 481-486. http://dx.doi.org/10.12677/AAM.2017.64057