Advances in Applied Mathematics
Vol.06 No.05(2017), Article ID:21726,6 pages
10.12677/AAM.2017.65082

Exploration to Achieve by MATLAB Modeling Linear Regression Processing, Processing Environmental Monitoring Data and Comparison with Excel Modeling

Jialiang Sun

School of Mathematics and Statistics, North China University of Water Resources and Electric Power, Zhengzhou Henan

Received: Jul. 22nd, 2017; accepted: Aug. 11th, 2017; published: Aug. 17th, 2017

ABSTRACT

This thesis, using linear regression theory and MATLAB mathematical software, explores the solution of the standard curve in the processing of environmental monitoring data. Compared with the Excel modeling method, this modeling method for solving the linear regression equation of standard curve, can make it’s error smaller and make it more accurate and simple to operate, and can improve the work efficiency. It can be fully used in the part of the chemical work.

Keywords:Environmental Monitoring, Standard Curve, Linear Regression, MATLAB

MATLAB建模实现线性回归处理环境监测数据的探索及与EXCEL建模的对比

孙嘉良

华北水利水电大学数学与统计学院,河南 郑州

收稿日期:2017年7月22日;录用日期:2017年8月11日;发布日期:2017年8月17日

摘 要

本文以线性回归理论为基础,运用MATLAB数学软件进行建模,针对环境监测数据处理中标准曲线法的求解问题进行探究。该建模方法所求得标准曲线的线性回归方程较Excel建模方法误差小,更为准确,可提高工作效率,在科研工作中可以得到一定应用。

关键词 :环境监测,标准曲线,线性回归,MATLAB

Copyright © 2017 by author and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

对于环境监测数据处理时求解标准曲线问题,其目的是利用得到的标准曲线计算待测物质的含量,以求精确评价所测水体环境或者采取合适的水处理工艺。

对此问题目前化学工作者运用基于Excel程序进行求解,如白云做过c++程序求解的探究 [1] ,其求解误差小,但是编程过程复杂。刘作云等运用最小二乘法基于Excel进行求解 [2] [3] [4] ,但得到的结果误差较大。求解标准曲线,对于化学工作者来说需要具有一定的数据处理能力以及软件操作能力,除此之外求得的标准曲线误差大小也是一直被关注与关心的。本文采用基于MATLAB的操作,将线性回归方法应用于光谱分析中,可以得到误差更小的标准曲线方程。并且本文对求解结果进行了p检验和F检验以及相关系数R的计算,结果都很好的符合要求。

2. 理论基础

线性回归利用线性回归方程的最小平方函数,对自变量和因变量之间的关系进行建模。国家规定的标准曲线做法是测定已知待测物质含量的标准试剂的吸光度值,得到一些离散点,求解通过这些点的一条直线。

由光吸收基本定律可知当实验条件满足要求时,待测物质的含量与吸光度呈线性关系,因而线性回归可运用于标准曲线求解。二者满足线性关系的前提下,影响吸光度值的条件中仅物质含量一个变量,因此采用一元线性回归分析来进行二者关系的建模。本文以吸光度值 为自变量,待测物含量 为因变量,建立一元线性回归模型:

[5]

步骤一:以国家规定的标准溶液浓度系列作为矩阵,实验得到对应的吸光度值矩阵,即

(*)

假定矩阵为需要顾及的系数向量,为随机误差向量 [6] 。

步骤二:对于准备好的数学模型,将其运用到MATLAB软件的操作当中,编程调用MATLAB中的regress函数作一元线性回归:

返回线性回归方程中系数向量的估计值b,regress函数将Y或X中不确定的数据作为缺失数据而忽略它们,使得误差会变小。最终可以得到回归方程系数的估计值。

步骤三:进行显著性检验和误差分析。通过得到的显著性检验相关参数,与临界值比较,采用残差进行误差分析,残差是衡量不确定性的指标,残差大小可以衡量预测的准确性,残差越大表示预测越不准确,残差与数据本身的分布特性和回归方程的选择有关。

其中为因变量的真实值,为估计值。

3. 案例分析

3.1. 案例一

以“紫外分光光度法”测总氮含量中标准曲线求解为例,在满足定量分析要点的基础上,计算出标准试剂的浓度和扣除空白后对应的校正吸光度值(以下直接称吸光度值),得到标准溶液的总氮含量(Y)和吸光度值(X),如下表1

构造出表中对应的线性回归矩阵算法如下:

MATLAB运行结果(表2~4,图1)

以上即利用MATLAB数学软件求得的结果及各统计参数,由表2可知求得回归方程(标准曲线方程)为

显著性检验

我们将原假设与对立假设分别为

1) 由表4检验p值为2.6847e−10,远小于0.01,可知显著性水平下应拒绝原假设,可认为吸光度值与浓度的线性关系是显著的;

2) 对于F统计量的观测值与临界值,当时,拒绝原假设,认为Y与X的线性关系是显著的 [7] ;反之,则接受原假设,认为Y与X的线性关系是不显著的。在表4中F统计量的观测值,可知吸光度值与浓度有显著的线性关系。

与Excel建模方法 [2] 进行对比

将案例一的数据运用Excel建模方法最终得到线性回归方程为:,求得其残差的均值为−5.46429e−09;在表3中得到Y的残差分析,可以看出通过MATLAB求得的线性回

Table 1. Total nitrogen standard reagent concentration and calibration absorbance value

表1. 总氮标准试剂浓度与校正吸光度值

Table 2. The estimate of the coefficients, 95% confidence upper limit and 95% lower confidence limit

表2. 系数的估计值与其置信上下限

Table 3. The real value of Y corresponds to the estimate, residual and 95% confidence interval

表3. Y的真实值对应的估计值、残差及95%置信区间

Table 4. F statistic observation value, p value, residual mean and R2

表4. F统计量观测值、p值、残差均值及R2

Figure 1. The standard curve fitting of total nitrogen

图1. 总氮的标准曲线拟合图

归方程的残差的均值(表4)在同样的精确度下为0,说明MATLAB建模较Excel建模的误差小,准确度高。

3.2. 案例二

下面以硝氮含量测定实验数据对所建立的模型进行检验,吸光度值X的数据如标准试剂中硝氮的含量Y下表5

MATLAB程序运行结果:(表6~8,图2)

表6,回归方程(标准曲线方程)为

显著性检验

表8得出p值为2.7987e−09远远小于0.01,F统计量的观测值为,可知该组数据的吸光度值与浓度有显著的线性关系。

与Excel建模方法 [2] 进行对比

将案例二的数据运用Excel建模方法最终得到线性回归方程为:,求得其残差的均值为−1.76667e−07;在表7中得到Y的残差分析,可以看出通过MATLAB求得的线性回归方程的残差的均值(表8)为−1.38778e−17,可以看

Table 5. Nitrate nitrogen standard reagent and calibration absorbance value

表5. 硝氮标准试剂浓度与校正吸光度值

Table 6. The estimate of the coefficients, 95% confidence upper limit and 95% lower confidence limit

表6. 系数的估计值与其置信上下限

Table 7. The real value of Y corresponds to the estimate, residual and 95% confidence interval

表7. Y的真实值对应的估计值、残差及95%置信区间

Table 8. F statistic observation value, p value, residual mean and R2

表8. F统计量观测值、p值、残差均值及R2

Figure 2. The standard curve fitting of nitrous nitrogen

图2. 硝氮的标准曲线拟合图

结果分析

两个案例基于不同的化学实验,测定的是不同的物质,标准物质的含量、吸光度值也不同,通过最终的实验结果可以看出,本文建立的模型可以适用于不同要求标准曲线方程的求解,且通过与Excel建模方法对比,可知MATLAB建模的误差较小,得到的回归方程准确度更高。

4. 结论

对于标准曲线的求解问题,一直未有基于MATLAB的线性回归分析方法。本文通过探索MATLAB建模实现线性回归,可快速的得到物质含量与吸光度值的标准曲线方程,同时和Excel建模对比,减小了误差,可以得到更准确的待测物质含量,从而得对水环境质量做出更为准确的评估。

文章引用

孙嘉良. MATLAB建模实现线性回归处理环境监测数据的探索及与EXCEL建模的对比
Exploration to Achieve by MATLAB Modeling Linear Regression Processing, Processing Environmental Monitoring Data and Comparison with Excel Modeling[J]. 应用数学进展, 2017, 06(05): 692-697. http://dx.doi.org/10.12677/AAM.2017.65082

参考文献 (References)

  1. 1. 白云. 利用C语言学习一元线性回归处理[J]. 湖北科技学院学报, 2015, 35(10): 195-197.

  2. 2. 刘作云. 最小二乘法处理环境监测数据及Excel建模探索[J]. 湖南生态科学学报, 2015, 2(3): 26-30.

  3. 3. 单文坡, 卢海霞, 郑辉. Excel和Origin在环境监测数据处理中的应用[J]. 石家庄职业技术学院, 2008, 20(2): 58- 60, 67.

  4. 4. 吴慧璇, 林宙峰, 郭益军. Excel软件在环境监测数据处理中的应用[J]. 科教文汇(上旬刊), 2007(7): 202.

  5. 5. 谢中华, 李国栋, 刘焕进, 吴鹏, 郑志勇. MATLAB从零到进阶[M]. 北京: 北京航空航天大学出版社, 2012: 377- 379.

  6. 6. 林彬. 多元线性回归分析及其应用[J]. 中国科技信息, 2010(9): 60-61.

  7. 7. 任建英. 一元线性回归分析及其应用[J]. 才智, 2012(22): 116-117.

期刊菜单