Modeling and Simulation
Vol. 11  No. 03 ( 2022 ), Article ID: 51526 , 13 pages
10.12677/MOS.2022.113072

基于多项式拟合与多元线性回归模型对乙醇 偶合制备C4烯烃的研究

耿超洋,邓文艺,郭海菲

上海理工大学光电信息科学与工程学院,上海

收稿日期:2022年4月3日;录用日期:2022年5月16日;发布日期:2022年5月23日

摘要

“乙醇催化偶合制备C4烯烃”在工业上应用广泛,而影响该反应的重要因素是其催化剂组合及温度,因此研究该反应的工艺条件,对提高C4烯烃生产效率具有重要意义。本文对多组交叉实验数据进行分析,采用控制变量的思想,使用相关系数和多项式拟合得到催化剂组合和温度与乙醇转化率、C4烯烃选择性的关系,并使用多元线性回归模型得到催化剂组合和温度与收率的关系,进而得到使C4烯烃产率最高的最优催化剂组合和最优温度。

关键词

C4烯烃制备,多项式拟合,多元线性回归

Research on Preparation of C4 Olefin by Ethanol Coupling Based on Polynomial Fitting and Multiple Linear Regression Model

Chaoyang Geng, Wenyi Deng, Haifei Guo

School of Opto-Electronic Information Science and Engineering, University of Shanghai for Science and Technology, Shanghai

Received: Apr. 3rd, 2022; accepted: May 16th, 2022; published: May 23rd, 2022

ABSTRACT

“Ethanol catalytic coupling to prepare C4 olefin” has been widely used in industry, and the important factors affecting the reaction are the combination of catalysts and temperature. Therefore, it is of great significance to study the technological conditions of this reaction to improve the production efficiency of C4 olefin. In this paper, sets of cross experimental data are analyzed, by adopting the idea of control variables, using the polynomial fitting and correlation coefficient of catalyst composition and temperature and ethanol conversion rate, the relationship between C4 olefin selectivity, and using multivariate linear regression model to get the relationship between the yield of catalyst composition and temperature, to get the highest production rate of C4 olefin optimal combination of catalyst and the optimal temperature.

Keywords:C4 Olefins Preparation, Polynomial Fitting, Multiple Linear Regression

Copyright © 2022 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

C4烯烃作为一种重要的化工原料,在医药和化工等领域具有重要的生产地位 [1]。C4烯烃的传统制备方法大多都依赖于不断减少的化石能源,成本较高,且环境污染较重。而乙醇作为一种持续、绿色的可替代新能源,具有易获取、易转换且污染小等优点。因此,由乙醇偶合制备C4烯烃的生产路线具有重要研究意义。

早期研究指出,乙醇偶合制备C4烯烃的反应过程会受到催化剂的影响。文献 [2] 研究了使用沸石催化剂时的反应过程;文献 [3] 则进一步研究了沸石催化剂的性质对反应的影响。除此之外,文献 [4] [5] 对另一种催化剂金属氧化物的研究也表明了催化剂在制备C4烯烃反应过程中的重要性。而在这些研究中也表明,温度也同样是影响反应过程的重要因素,故研究催化剂组合和反应温度对乙醇偶合制备C4烯烃此反应是十分必要的。

本文在前人研究的基础上,对高教社杯数学建模B题中提供的实验数据 [6] 进行分析建模,分别使用相关系数和基于最小二乘法多项式拟合研究温度与催化剂组合对C4烯烃的选择性和乙醇转化率的影响,最后利用多元线性回归得到了在当前实验条件下C4烯烃产率最高时对应的催化剂配比与反应温度。

2. 温度与乙醇转化率及C4烯烃选择性的关系

实验首先将催化剂组合固定,在其他条件相同时,以温度为自变量,研究乙醇转化率和C4烯烃的选择性这两个因变量。首先通过对数据的初步分析确定温度与乙醇转化率及C4烯烃选择性是否存在相关性及相关性大小,其次根据所得相关性大小再进行后续数据拟合,以确定具体关系。

2.1. 散点图分析

由于数据量较大且不直观,无法直接得出相关性关系,在无明显相关性时直接使用相关系数的计算可能会导致结论误差较大,故先将数据绘制成散点图进行初步分析。利用SPSS绘制散点图所使用的数据 [6] 为四组不同组合的催化剂(A1、A2、A3、A12),如图1所示,其他催化剂条件下同理可得。

通过对图1的散点图分析,可得到以下结论:

1) 在温度区间[250, 400]内,乙醇的转化率与温度的相关性较强,为正相关,并且接近线性。

Figure 1. Scatter plot of the relationship between temperature and ethanol conversion and C4 olefins selectivity in four groups

图1. 四组实验温度与乙醇转化率及C4烯烃选择性关系的散点图

2) 在温度区间[250, 400]内,C4烯烃选择性与温度之间存在正相关关系。

3) 随着温度的升高,乙醇转化率和C4烯烃的选择性提高。

2.2. 相关性检验

由SPSS绘制的散点图可以看出,温度与乙醇转换率其具有线性关系,为了进一步研究二者的相关性强弱,对二者的Pearson相关系数进行计算。Pearson相关系数作为去除两个变量之间量纲影响的标准化的协方差,能反映两变量之间的相关性大小。

Pearson相关系数的应用需要满足以下三个条件:

1) 两变量都是连续变量。

2) 两个变量之间存在线性关系。

3) 变量服从正态分布。

通过对实验设计流程和对实验数据的散点图简单分析可知条件1,2显然满足,为了保证结果的可靠性,需验证数据是否符合正态分布,因为需要探讨的数据范围属于小样本,因此使用夏皮洛–威尔克检验。

2.2.1. 正态分布检验

根据实验数据,研究温度与乙醇转换率以及和C4烯烃选择性的关系。以温度、乙醇转化率、C4烯烃选择性分别为三列向量,以包含数据最多的A3组为例。其他催化剂条件下同理可得。

提出假设:

H 0 :温度、乙醇转化率或C4烯烃选择性作为随机变量符合正态分布;

H 1 :温度、乙醇转化率或C4烯烃选择性作为随机变量不符合正态分布;

通过SPSS计算出威尔克统计量,得到p值,见表1

Table 1. Schapiro-Welk normal test

表1. 夏皮洛–威尔克正态检验

将p值与0.05比较,由于p > 0.05,因此该变量符合正态分布。

经过以上讨论,变量满足Pearson相关系数的条件,可进行Pearson相关系数检验。

2.2.2. Pearson相关系数求解

假设温度为 X : { x 1 , x 2 , , x n } ,乙醇转化率为 Y : { y 1 , y 2 , , y n } ,C4烯烃的选择性为 Z : { z 1 , z 2 , , z n }

Pearson相关系数分别为

{ r X Y = C o v ( X , Y ) S X S Y r X Z = C o v ( X , Z ) S X S Z

其中

{ C o v ( x , y ) = i = 1 n ( x i x ¯ ) ( y i y ¯ ) n 1 C o v ( x , z ) = i = 1 n ( x i x ¯ ) ( z i z ¯ ) n 1

{ s x = i = 1 n ( x i x ¯ ) 2 n 1 s y = i = 1 n ( y i y ¯ ) 2 n 1 s z = i = 1 n ( z i z ¯ ) 2 n 1

Pearson相关系数需要列向量,因此分别将每组催化剂组合的温度、乙醇转化率和C4烯烃转化率分别作为列向量,得到21组不同催化剂组合乙醇转化率与温度的Pearson相关系数、C4烯烃选择性与温度的Pearson相关系数。

利用MATLAB求解得到21组实验的乙醇转化率与温度的Pearson相关系数(R_X)、C4烯烃选择性与温度的Pearson相关系数(R_Y),所有Pearson系数如下表2所示。

Table 2. Pearson correlation coefficient

表2. Pearson相关系数

由表中数据可得,14组实验的乙醇转化率与温度的Pearson相关系数几乎全部大于0.9,且集中在0.9附近,由此可知在95%的置信水平下,温度与乙醇转化率呈线性正相关,且相关性很强。而温度与C4烯烃选择性的Pearson相关系数结果相对分散。

2.3. 基于最小二乘法多项式数据拟合

随着温度和催化剂组合的改变,在已有的温度区间内认为温度与乙醇转化率呈线性正相关,与C4烯烃的选择性具有一定的正相关性,但具体的函数关系无法确定,为了进一步探究温度与乙醇转化率与C4烯烃选择性的关系,本文尝试建立温度与二者的函数关系,而在科学试验中所得数据往往会带有误差,故本文拟通过最小二乘法拟合多项式的方法来进行数据处理,建立温度和乙醇转化率以及和C4烯烃选择性的曲线模型 [7]。

2.3.1. 拟合模型的建立

在一组实验数据 ( x i , y i ) ( i = 1 , 2 , , m ) 进行最小二乘曲线拟合时,近似表达式 y = p ( x ) 具有多项式形式:

p n ( x ) = k = 0 n a k x k = a 0 + a 1 x + a 2 x 2 + + a n x n ( n < m )

上式是关于x的n次多项式,由最小二乘法定义,通过给定的数据组确定系数 a j ,使得各个点上的偏差平方和 I = i = 1 m δ i 2 = i = 1 m [ k = 0 n a k x i k y i ] 2 达到最小。则需要对 a 0 , a 1 , , a n 分别求偏导,使其偏导分别为零:

{ 2 i = 1 n [ y ( a 0 + a 1 x + + a k x k ) ] = 0 2 i = 1 n [ y ( a 0 + a 1 x + + a k x k ) ] x = 0 2 i = 1 n [ y ( a 0 + a 1 x + + a k x k ) ] x k = 0

将这些等式变形后表示为矩阵形式就可以得到:

[ n i = 1 n x i i = 1 n x i k i = 1 n x i i = 1 n x i 2 i = 1 n x i k + 1 i = 1 n x i k i = 1 n x i k + 1 i = 1 n x i 2 k ] [ a 0 a 1 a k ] = [ i = 1 n y i i = 1 n x i y i i = 1 n x i k y i ]

将该范德蒙德矩阵化简后可得:

[ 1 x 1 x 1 k 1 x 2 x 2 k 1 x n x n k ] [ a 0 a 1 a k ] = [ y 1 y 2 y n ]

由此方程即可得到 a 0 , a 1 , , a n ,带入 p n ( x ) = k = 0 n a k x k 即可得到最小二乘拟合多项式结果。

在一组数据 y = { y 1 , y 2 , , y n } 的拟合过程中,拟合结果的好坏由拟合优度R2来评定,R2越接近于1,说明拟合程度越好。其中,

R 2 = S S R S S T = S S T S S E S S T = 1 S S E S S T

其中误差平方和

S S E = i = 1 n ( y i y ^ i ) 2

总体平方和

S S T = i = 1 n ( y i y ¯ ) 2

在多次拟合后,选取R2最大的或SSE最小的拟合结果即可。

基于前文分析,温度与乙醇转化率的Pearson系数几乎全部大于0.9,故拟合时直接采用幂级数为一次的多项式拟合,即为线性拟合。设拟合曲线为

y = k x i + b

而温度与C4烯烃选择性的关系则需要根据拟合后的拟合优度来选择拟合方程。

2.3.2. 拟合模型的求解

对于温度与乙醇转化率的拟合方程,利用MATLAB对数据进行多项式拟合,可得k和b的值如表3所示。

Table 3. Table of k and b parameters of fitting equation of different catalyst combinations

表3. 不同催化剂组合拟合方程k和b参数表

在研究温度与C4烯烃的选择性的拟合曲线时,经过多次拟合尝试后,一次函数的拟合结果更具有普适性,对应的参数值如表3所示。

一般而言,在给定m对测量点的条件下,多项式的幂级数越高,拟合程度越好,但是高阶多项式的正规方程会倾向于病态,求解的系数可能是不准确的 [7]。在本文中研究温度与C4烯烃选择性的关系时,多项式拟合幂级数为三次,拟合优度可达到0.9以上,但方程已倾向于病态,因此不能作为表示两者关系的表达式。这也是在工程中进行数据拟合时需要注意的问题。

21组数据的拟合优度 R 2 均大于0.75,表明拟合方程可以较好的对散点数据进行表达。因此,随着温度的升高,乙醇转化率以及C4烯烃选择性呈线性增加。

3. 不同催化剂组合对C4烯烃收率的影响

3.1. 数据预处理

为了后续进行对最有催化剂的选择,本文着重研究了催化剂中不同成分对C4烯烃收率的影响,并试图建立相应的函数关系。为了更好地进行后续研究,首先对数据进行分类和处理。

A11组催化剂中的HAP含量为零,本组实验使用石英砂代替了HAP,经计算,本组的C4烯烃收率(乙醇转化率 × C4烯烃选择性)最高为2.58%,在工业中不具有应用价值,故在接下来不予考虑。

3.2. 拟合处理

经分析发现,催化剂条件分别为200 mg 1 wt% Co/SiO2、200 mg HAP、乙醇浓度1.68 mL/min、350℃这些条件在控制变量后可以覆盖最多的数据量。

在完成数据预处理后,使用MATLAB对单一变量和C4烯烃收率进行基于最小二乘法的多项式拟合,原理已在第二节给出。

Co/SiO2 (或HAP)的质量为单一变量时,控制变量后的数据如表4所示。

Table 4. Yield at different Co/SiO2 masses

表4. 不同Co/SiO2的质量下的收率

使用MATLAB对变量进行拟合,拟合图像如图2所示。

数据组在多项式拟合最高次数为三次时拟合效果最好,可以认为Co/SiO2 (或HAP)的质量与C4烯烃的收率近似为三次函数关系。

Co负载率为单一变量时,控制变量后的数据如表5所示。

进行三次多项式拟合后的曲线如图3所示。

乙醇浓度为单一变量时,数据处理如下,如表6所示。

Figure 2. Fitting curves of different Co/SiO2 (or HAP) mass and C4 olefins yield

图2. 不同Co/SiO2 (或HAP)质量与C4烯烃收率的拟合曲线

Figure 3. Fitting curves of different Co loading rates and C4 olefin yield

图3. 不同Co负载率与C4烯烃收率的拟合曲线

Table 5. Yield at different Co loading rates

表5. 不同Co负载率下的收率

Table 6. Yield at different ethanol concentrations

表6. 不同乙醇浓度下的收率

使用MATLAB对变量进行拟合,拟合图像如图4所示。

Figure 4. Fitting curve of different ethanol concentration and C4 olefin yield

图4. 不同乙醇浓度与C4烯烃收率的拟合曲线

Table 7. Fitting results of different catalyst composition and C4 olefin yield

表7. 不同催化剂成分与C4烯烃收率的拟合结果

从数据拟合的结果(见表7)可以看出,Co/SiO2 (或HAP)的质量与Co的负载率与C4烯烃的收率都呈三次函数的相关关系,存在极大值作为后续研究对象,而乙醇的加入速率则与C4烯烃的收率呈负相关关系。

除此之外,在对数据进行处理时,A13组(Co/SiO2和HAP 装料比为2:1)和A14组(Co/SiO2和HAP装料比为1:2)的C4烯烃收率与其他条件相同的其他组对比明显降低,因此在最优催化剂的选择时,应将Co/SiO2和HAP装料比控制在“1”的附近,以保障较高的C4烯烃收率。

对比结果如图5所示。

Figure 5. Yield of C4 olefin in groups A1, A12, A13 and A14

图5. A1、A12、A13、A14组C4烯烃收率

3.3. 最优催化剂的选择

基于前文分析,本文希望可以通过选择最优催化剂,使C4烯烃收率最高。在最优催化剂的选择中,要研究多个自变量同时对一个因变量的影响,同时最后需要求得当因变量最大时,各个自变量的取值。在研究此问题时,本问拟用多元非线性回归模型来进行分析。该模型考虑了在单变量研究时得到的相关性,将三个自变量结合到了一起,构建了一个多元非线性模型。

在前文研究各个单变量和C4烯烃收率的相关性的基础上,构建多元非线性回归模型。在此模型中,为了避免方程趋于病态,引入显著性概率 P 来表示检测模型拟合是否有意义。

在模型中一共有三个变量,分别是Co/SiO2 (或HAP)的质量、乙醇浓度和Co负载量。设三个自变量为 x 1 , x 2 , x 3 ,建立模型如下:

y = β 1 x 1 3 + β 2 x 1 2 + β 3 x 1 + β 4 x 2 + β 5 x 3 3 + β 6 x 3 2 + β 7 x 3 + β 8

利用nlinfit函数对数据进行回归,得出beta系数的值 [8],如表8所示。

Table 8. The value of the regression coefficient b

表8. 回归系数b值

最终得到的方程为:

y = 0.000002 x 1 3 0.0008 x 1 2 + 0.2510 x 1 1.9855 x 2 0.0921 x 3 3 + 1.7164 x 3 2 4.8835 x 3 11.7653

回归得到的显著性概率P = 0.015 < 0.05,可以认为该回归模型具有意义。

则该方程为催化剂组合中三个变量与C4烯烃收率之间的函数关系。

通过分析多元非线性回归方程,可以得到,A3催化剂组合对应的C4烯烃收率最高,由此可判断,在温度相同的情况下,A3组催化剂催化条件最好。

3.4. 最优温度的选择

在选择最优温度时,本文在前文的基础上进行进一步的研究。A3组的C4烯烃收率与温度的关系如图6所示,在400℃附近存在极大值。

Figure 6. C4 olefin yield of A3

图6. A3组的C4烯烃收率

Figure 7. Fitting curve of C4 olefin yield at A3 group temperature

图7. A3组温度与C4烯烃收率的拟合曲线

因此对A3组温度和C4烯烃收率做多项式拟合,根据多次尝试,四次多项式拟合曲线效果最好。拟合结果如图7所示。

四次多项式拟合结果为拟合优度 R 2 = 0.9966,误差平方和SSE = 7.207。即认为该拟合曲线可以很好地表达散点数据。

图6图7可知,在A3组催化剂条件下,最佳温度为426摄氏度,在此温度下,C4烯烃收率达到最大值。

4. 结论分析

本文通过对已有的实验数据进行分析后建立数学模型,探究了基于实验数据下乙醇偶合制备C4烯烃的最佳催化剂组合和最佳实验温度。首先基于控制变量思想,在温度或催化剂组合后固定时,研究另一项对乙醇转化率以及C4烯烃选择性的影响,研究结果表明,在温度在[250, 450]区间内,温度与乙醇转化率以及C4烯烃选择性均为正相关关系。又有C4烯烃的收率表示为乙醇转化率与C4烯烃选择性的乘积,又研究了催化剂组合与C4烯烃收率的关系,可以得到HAP与Co的负载量都与收率呈三次函数关系,而乙醇的加入速率与收率则呈负相关关系。

最后利用多元线性回归模型求出C4烯烃收率最大时的最优催化剂组合配比及最优温度:即在其他条件相同的情况下,催化剂组合为200 mg 1 wt% Co/SiO2-200 mg HAP-乙醇浓度0.9 mL/min,温度为426℃时C4烯烃产率最高,对于指导C4烯烃的工业生产具有一定的参考价值。

文章引用

耿超洋,邓文艺,郭海菲. 基于多项式拟合与多元线性回归模型对乙醇偶合制备C4烯烃的研究
Research on Preparation of C4 Olefin by Ethanol Coupling Based on Polynomial Fitting and Multiple Linear Regression Model[J]. 建模与仿真, 2022, 11(03): 768-780. https://doi.org/10.12677/MOS.2022.113072

参考文献

  1. 1. 吕绍沛. 乙醇偶合制备丁醇及C4烯烃[D]: [硕士学位论文]. 辽宁: 大连理工大学, 2018.

  2. 2. Aguayo, A.T., Gayubo, A.G., Atutxa, A., et al. (2002) Catalyst Deactivation by Coke in the Transformation of Aqueous Ethanol into Hydrocarbons. Kinetic Modeling and Acidity Deterioration of the Catalyst. Industrial & Engineering Chemistry Research, 41, 4216-4224. https://doi.org/10.1021/ie020068i

  3. 3. Song, Z., Takahashi, A. and Mimura, N. and Fujitani, T. (2009) Production of Propylene from Ethanol over ZSM-5 Zeolites. Catalysis Letters, 131, 364-369. https://doi.org/10.1007/s10562-009-0071-3

  4. 4. Cheng, K., Gu, B., Liu, X., Kang, J., Zhang, Q. and Wang, Y. (2016) Direct and Highly Selective Conversion of Synthesis Gas into Lower Olefins: Design of a Bifunctional Catalyst Combining Methanol Synthesis and Carbon-Carbon Coupling. Angewandte Chemie International Edition, 55, 4725-4728. https://doi.org/10.1002/anie.201601208

  5. 5. Pawelec, B., Guil-López, R., Mota, N., Fierro, J.L.G. and Navarro Yerga, R.M. (2021) Catalysts for the Conversion of CO2 to Low Molecular Weight Olefins—A Review. Materials, 14, 6952. https://doi.org/10.3390/ma14226952

  6. 6. 中国工业与应用数学学会. 2021高教社杯全国大学生数学建模竞赛赛题[EB/OL]. http://www.mcm.edu.cn/html_cn/node/4d73a36cc88b35bd4883c276afe39d89.html, 2021-09-09.

  7. 7. 卢治功, 贺鹏, 职连杰, 陈文建. 基于最小二乘法多项式拟合三角测量模型研究[J]. 应用光学, 2019, 40(5): 853-858.

  8. 8. 董大校. 基于MATLAB的多元非线性回归模型[J]. 云南师范大学学报(自然科学版), 2009, 29(2): 45-48.

期刊菜单