对圆域上的二元二次多项式回归模型在遵循设计点“对称 + 均匀”的前提下,给出并证明其特定的内接正方形的顶点和圆心组成的饱和设计是D-最优设计,并给出了相应设计的最小二乘估计,是把最优设计理论应用到多元多项式回归模型的又一有益的尝试。 For duality quadratic polynomial regression models in circle region, D-op designs were given and proved according to the criterion “Symmetry + Uniform” with four vertexes of special square and central angle in Circle, and the least squares estimates were given, It is a very useful attempt to apply optimal design theory to polynomial regression models.
孔庆海
东北大学理学院,辽宁 沈阳
收稿日期:2019年7月1日;录用日期:2019年7月16日;发布日期:2019年7月23日
对圆域上的二元二次多项式回归模型在遵循设计点“对称 + 均匀”的前提下,给出并证明其特定的内接正方形的顶点和圆心组成的饱和设计是D-最优设计,并给出了相应设计的最小二乘估计,是把最优设计理论应用到多元多项式回归模型的又一有益的尝试。
关键词 :回归模型,D-最优设计,测度,饱和设计,最小二乘估计
Copyright © 2019 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
在试验设计中,令R表示设计利益区域,X是区域R内任一点,回归模型一般形为
y = f T ( X ) β + ε
其中 f T ( X ) = ( f 1 ( X ) , f 2 ( X ) , ⋯ , f p ( X ) ) 是由模型决定的函数向量,y是响应观测值,而 β T = ( β 1 , β 2 , ⋯ , β p ) 是模型中的待估参数, ε 是误差,通常假设 E ( ε ) = 0 , D ( ε ) = σ 2 , σ 是已知的。
如果用 M ( ξ ) 表示测度设计 ξ 的信息矩阵,所谓的D-最优准则就是使得 M ( ξ ) 的行列式达到最大,而且测度设计 ξ ∗ 是D-最优设计的充分必要条件 [
多元多项式回归模型可以用来处理一大类非线性问题,在应用数理统计学中占有重要地位。这里讨论的二元二次多项式回归模型
y = β 0 + β 1 x + β 2 y + β 11 x 2 + β 22 y 2 + ε (1)
这里因子空间是圆域 ℜ = { ( x , y ) | x 2 + y 2 ≤ 1 } ,在模型中含有五个待估参数,我们尝试用圆域上的五个设计点去进行饱和设计,同时使得这些设计点的结构既要对称 [
对模型(1)的饱和设计 ξ 的基本思想是:先取圆周的任意内接正方形的四个顶点和圆心组成的五点设计,不妨取圆心为坐标原点,两个互相垂直的直径分别为x轴,y轴,设五个设计点分别是 ( a , b ) , ( − a , − b ) , ( b , − a ) , ( − b , a ) , ( 0 , 0 ) 。
而且采用测度设计,记每个顶点的测度为 α ,圆心的测度为 β ,即测度矩阵 D ( ξ ) = d i a g ( α , α , α , α , β ) ,其中 4 α + β = 1 , α > 0 , β > 0 。
可将模型(1)的函数向量改写为
f T ( X ) = ( 1 , x 2 , y 2 , x , y )
设饱和设计 ξ 的结构矩阵为X,
X = [ 1 a 2 b 2 a b 1 a 2 b 2 − a − b 1 b 2 a 2 b − a 1 b 2 a 2 − b a 1 0 0 0 0 ] ,
相应设计 ξ 的信息矩阵为 M = X T D ( ξ ) X ,利用 a 2 + b 2 = 1 ,则
M = ( 1 2 α 2 α 0 0 2 α 2 ( a 4 + b 4 ) α 4 a 2 b 2 α 0 0 2 α 4 a 2 b 2 α 2 ( a 4 + b 4 ) α 0 0 0 0 0 2 α 0 0 0 0 0 2 α )
要寻求模型的D-最优设计,即使得行列式 | M | 取最大值的设计,而
| M | = 16 α 4 ( 1 − 4 α ) ( 2 a 2 − 1 ) 2
令 { ∂ | M | ∂ α = 0 ∂ | M | ∂ a = 0 ,则有效驻点是 { α = 1 5 a = 0 , { α = 1 5 a = ± 2 2 ,
这两组驻点能使得 | M | 取最大值的,只有在驻点 α = 1 5 , a = 0 时达到,此时 | M | max = 16 5 5 ,此时 α = β = 1 5 ,说明测度设计是均匀的,设计点呈对称结构,它们是 ( 0 , 1 ) , ( 0 , − 1 ) , ( 1 , 0 ) , ( − 1 , 0 ) , ( 0 , 0 ) 。
下面证明上述五点设计对模型(1)是D-最优设计,由前文知,只要能验证
d = f T ( X ) M − 1 ( ξ ∗ ) f ( X ) ≤ 5 。
此时
M − 1 ( ξ ∗ ) = ( 5 − 5 − 5 0 0 − 5 15 2 5 0 0 − 5 5 15 2 0 0 0 0 0 5 2 0 0 0 0 0 5 2 ) ,
d = 5 − 15 2 ( x 2 + y 2 ) + 15 2 ( x 4 + y 4 ) + 10 x 2 y 2
在区域 ℜ = { ( x , y ) | x 2 + y 2 ≤ 1 } 的极大值情况为
① 在 ℜ 的内部 x 2 + y 2 < 1 ,由 { ∂ d ∂ x = 30 x 3 + 20 x y 2 − 15 x = 0 ∂ d ∂ y = 30 y 3 + 20 x 2 y − 15 y = 0 ,则
{ x = 0 y = 0 d = 5 , { x = 0 y 2 = 1 2 d = 25 8 , { x 2 = 1 2 y = 0 d = 25 8 , { x 2 = 3 10 y 2 = 3 10 d = 11 4
② 在 ℜ 的边界 x 2 + y 2 = 1 ,有 d = 5 − 5 x 2 ( 1 − x 2 ) ≤ 5 ,当且仅当在 x = 0 , ± 1 的时候取最大值。
由①②知道方差函数,即正定二次型d的最大值是5 (等于模型中的待估参数的个数),而且当且仅当在上述设计点处才取得最大值,这就证明了所采用的饱和均匀的等测度设计是D最优设计。
由于模型(1)的待估参数向量为 β → = ( β 0 , β 11 , β 22 , β 1 , β 2 ) T ,模型(1)可以记为
y = f T ( X ) β → + ε
由最小二乘估计公式 [
β → ^ = ( X T X ) − 1 X T Y = 1 5 M − 1 X T Y (2)
这里列向量 Y = ( y 1 , y 2 , y 3 , y 4 , y 5 ) T ,其中 y i ( i = 1 , 2 , 3 , 4 , 5 ) 表示第i次试验的响应观测值。把上述的 M − 1 , X T , Y 的结果代入式(2),则得到 β → 的最小二乘估计为
β → ^ = ( β ^ 0 β ^ 11 β ^ 22 β → ^ 1 β → ^ 2 ) = ( y 5 1 2 ( y 1 + y 2 ) − y 5 1 2 ( y 3 + y 4 ) − y 5 1 2 ( y 1 − y 2 ) 1 2 ( y 3 − y 4 ) ) 。
孔庆海. 圆域上的二元二次多项式回归模型的D-最优设计D-Optimal Design for Duality Quadratic Polynomial Regression Models in Circle Region[J]. 应用数学进展, 2019, 08(07): 1239-1242. https://doi.org/10.12677/AAM.2019.87143