教育测量与教学评价是教学活动的重要组成部分,是教学领域中进行科学管理的重要手段和提高教育质量的有效保证。教学评价中的主要内容之一是考试成绩及其影响因素的分析。目前,用于考试(测验)成绩及其影响因素分析的方法主要有描述性分析、聚类分析、主成分分析、因子分析和多元线性回归分析等。然而,在教学评价中,往往需要分析具有层次结构的数据,如不同学校或同一学校不同专业学生的考试成绩。具有层次结构的资料不适宜用上述方法分析,宜用多水平模型。本文基于某地区60所中学1653名初中二年级学生数学考试成绩的样本数据,建立了数学考试成绩及其影响因素的多水平模型。结果表明:学校、性别和家庭受教育程度对学生的数学考试成绩有显著影响。 Education measurement and teaching evaluation is an important part of teaching activities. One of the main parts in teaching evaluation is the analysis of examination results and its influencing factors. At present, the main methods include descriptive analysis, cluster analysis, principal component analysis, factor analysis and multiple linear regression analysis. However, the data with hierarchical structure is not suitable to be analyzed by the above methods. Based on the sample data, a multi-level model is established. The results showed that school, gender and family were significantly affected by education.
秦川
云南财经大学,统计与数学学院,云南 昆明
收稿日期:2019年1月21日;录用日期:2019年2月5日;发布日期:2019年2月12日
教育测量与教学评价是教学活动的重要组成部分,是教学领域中进行科学管理的重要手段和提高教育质量的有效保证。教学评价中的主要内容之一是考试成绩及其影响因素的分析。目前,用于考试(测验)成绩及其影响因素分析的方法主要有描述性分析、聚类分析、主成分分析、因子分析和多元线性回归分析等。然而,在教学评价中,往往需要分析具有层次结构的数据,如不同学校或同一学校不同专业学生的考试成绩。具有层次结构的资料不适宜用上述方法分析,宜用多水平模型。本文基于某地区60所中学1653名初中二年级学生数学考试成绩的样本数据,建立了数学考试成绩及其影响因素的多水平模型。结果表明:学校、性别和家庭受教育程度对学生的数学考试成绩有显著影响。
关键词 :多水平模型,数学考试成绩,性别,家庭受教育程度
Copyright © 2019 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
教育测量与教学评价是教学活动的重要组成部分,是教学领域中进行科学管理的重要手段和提高教育质量的有效保证。学校效能的评估作为当前教育测验中的一个重要课题,其结果的好坏对学生以及学校均有着重要影响。教育测量是教学评价中收集信息的主要途径。其测量方法有观察法、谈话法、问卷法和测验法等,考试和测验是测验法中的常用形式。教学评价是根据一定的研究目的,运用科学的技术和方法,对教学活动的过程和结果进行测定、分析和比较,并给予价值判断的过程。通常,人们把考试成绩及其影响因素的分析作为教学评价中的主要内容之一。因而,进行考试成绩及其影响因素分析方法的研究具有重要的现实意义和实用价值 [
目前,用于考试成绩及其影响因素分析的方法主要有描述性分析、聚类分析、主成分分析、因子分析和多元线性回归分析等。然而,在教学评价中,往往需要分析不同学校的考试成绩,此时的数据往往因学校师资、教学条件、学生生源的不同,而存在层次结构。上述方法不适宜分析具有层次结构的数据。
多水平模型(Multilevel Models)适用于分析具有层次结构的数据,它是由Lindley和Smith与1972年提出的,但因其受传统参数估计方法和计算技术的限制,未能得到推广应用;随着其他学者对模型参数进行改进了,特别是相应软件(HLM, Mlwin)的开发,从而推动了多水平模型理论和应用的发展。本研究拟将多水平模型运用于中学学生数学考试成绩分析中,对影响学生考试成绩的因素做出正确的评价和解释。
本文采用Raudenbush, S.W., Bryk, A.S., & Congdon, R.于2017年提供的美国某地区的60所中学1653名二年级学生的数学考试成绩、性别、父母受教育程度、学校规模人数等样本数据作为主要的研究指标 [
对学生数学成绩影响因素的分析,首先用OLS模型进行了估计,但是由于不同地区的学校存在着师资条件、办学方式等不同,所以,学生们的考试成绩既受到自身特征的影响,也受到学校的影 。因此,在这种情况下,如果采用经典的最小二乘估计方法可能会导致有偏参数估计结果 [
经典模型的基本假定是单一水平和单一的随机误差项,并假定随机误差项独立、服从方差为常量的正态分布,代表不能用模型解释的残留的随机成分。
多水平模型 [
y i j = β o j + β 1 X i j + e i j (1)
β 0 j = γ 00 + μ 0 j (2)
y i j 和 X i j 分别为第j个学校中第i个学生应变量观测值和解释变量观测值。 γ 00 是 β 0 j 的平均值,为固定成份, μ 0 j 为水平2上( β 0 j )的随机成分,服从正态分布。 e i j 表示水平1上的随机误差,也服从正态分布。把(2)式代入(1)式并整理,得:
y i j = ( γ 00 + β 1 X i j ) + ( μ 0 j + e i j ) (3)
在(3)式中, ( γ 00 + β 1 X i j ) 表示固定效应部分, ( μ 0 j + e i j ) 表示随机效应部分(残差项)。如果同时假定水平1上的残差与水平2上的残差相互独立,即 C o v ( μ 0 j , e 0 i j ) = 0 ,则因变量的方差为:
V a r ( y i j | γ 00 , β 1 , X i j ) = V a r ( μ 0 j + e 0 i j ) = V a r ( μ 0 j ) + V a r ( e 0 i j ) + C o v ( μ 0 j , e 0 i j ) = σ μ 0 2 + σ e 0 2
此即水平2和水平1方差之和。
同一学校中两学生(用 i 1 , i 2 表示)间的协方差为:
C o v ( μ 0 j + e i 1 j , μ 0 j + e i 2 j ) = C o v ( μ 0 j , μ 0 j ) = σ μ 0 2
在多水平的实际估计中,是否存在组内相关,可以通过组内相关(ICC)公式进行评价:
ρ = σ μ 0 2 σ μ 0 2 + σ e 0 2 (4)
ICC测量了学校间方差占总方差的比例,实际上它反映了学校内个体间相关,即水平1单位(学生)在水平2单位(学校)中的聚集性或相似性。由于模型不止一个残差项,就产生了非零的组内相关。若ICC为0,表明数据不具备层次结构,可忽略学校的存在,即转化为传统的单水平模型;反之,若存在非零的 σ μ 0 2 ,则不能忽略学校的存在。
第一层 y i j = β 0 j + e i j
第二层 β 0 j = γ 00 + μ 0 j
利用SPSS软件进行分析,结果如表1所示 [
固定效应的检验类型 | |||||||
---|---|---|---|---|---|---|---|
源 | 分子 df | 分母 df | F | 显著性 | |||
截距 | 1 | 56.603 | 14.248 | 0.000 | |||
固定效应估计a | |||||||
参数 | 估计 | 标准误差 | df | T | 显著性 | 95%置信区间 | |
下限 | 上限 | ||||||
截距 | −0.267943 | 0.070984 | 56.603 | −3.775 | 0.000 | −0.410107 | −0.125779 |
(γ00 = −0.267943) | |||||||
协方差参数估计 | |||||||
参数 | 估计 | 标准误差 | Wald Z | 显著性 | 95%置信区间 | ||
下限 | 上限 | ||||||
残差 | 1.148051 | 0.040639 | 28.250 | 0.000 | 1.071099 | 1.230531 | |
截距[个体 = schoolid] | 方差 | 0.337798 | 0.054257 | 4.383 | 0.000 | 0.252053 | 0.471895 |
( σ e 0 2 = 1.148051 , σ u 0 2 = 0.337798 ) |
表1. 假设无解释变量时的模型检验结果
反映学校差异的估计值为0.337798,具有统计学意义,不同学校教学水平有差异 [
第一层 y i j = β 0 j + β 1 j S e x i j + e i j
第二层 β 0 j = γ 00 + μ 0 j
性别也有可能对学生的数学考试成绩有影响。将性别信息纳入到模型中,其中 S e x i j 表示的是第j个学校中第i个学生的性别。当性别为女时取1,性别为男时取0。利用SPSS分析的结果如表2所示:
固定效应估计 | |||||||
---|---|---|---|---|---|---|---|
参数 | 估计 | 标准误差 | df | T | 显著性 | 95%置信区间 | |
下限 | 上限 | ||||||
截距 | −0.229136 | 0.076175 | 74.088 | −3.008 | 0.004 | −0.380915 | −0.077357 |
[female = 0] | −0.076440 | 0.053512 | 1612.658 | −1.428 | 0.053 | −0.181400 | 0.028519 |
[female = 1] | 0a | 0 | . | . | . | . | . |
( γ 00 = − 0.229136 , β 1 j = − 0.07644 ) |
表2. 引入性别变量后的模型检验结果
对性别固定效应进行检验,P = 0.053,说明性别对数学考试成绩有影响。
第一层 y i j = β 0 j + β 1 j S e x i j + β 2 P E i j + e i j
第二层 β 0 j = γ 00 + μ 0 j
除了性别以外,父母受教育程度也可能对学生的考试成绩有影响 [
固定效应估计 | |||||||
---|---|---|---|---|---|---|---|
参数 | 估计 | 标准误差 | df | t | 显著性 | 95%置信区间 | |
下限 | 上限 | ||||||
截距 | −0.427438 | 0.079257 | 94.752 | −5.393 | 0.000 | −0.584789 | −0.270088 |
[female = 0] | −0.070110 | 0.053161 | 1614.155 | −1.319 | 0.018 | −0.174382 | 0.034163 |
[female = 1] | 0a | 0 | . | . | . | . | . |
[PE = 0] | 0.474390 | 0.085345 | 613.302 | 5.559 | 0.000 | 0.306787 | 0.641993 |
[PE = 1] | 0a | 0 | . | . | . | . | . |
( γ 00 = − 0.427438 , β 1 j = − 0.07011 , β 2 = 0.474390 ) |
表3. 引入性别和教育变量后的模型检验结果
对固定效应进行检验,所有的P值都小于0.05,说明性别、父母教育背景对学生的考试成绩都有影响。−0.07011说明男生比女孩生成绩低,0.474390说明上过大学的父母的孩子比没有上过的父母的孩子的考试成绩高。
本文基于Raudenbush, S.W., Bryk, A.S., & Congdon, R.于2017年提供的1653个样本数据,通过建立学生数学考试成绩及其影响因素的多水平模型,对学生考试成绩及其影响因素之间的因果关系进行了简单的实证分析,结果显示学生考试成绩在学校和学生个体水平上均存在变异,变量分布及其相关影响因素的效应可分为2类:一是地区、学校内的效应,其中最重要的影响因素是性别和家庭教育;二是层次或水平效应,这个效应是由于学校之间的教学条件、生源质量不同所致。本研究通过建立多水平模型分析学生们的数学成绩影响因素,说明了学校之间的变异不容忽视,更好的解释了变异的来源。其次,通过多水平模型分析,结合实际情况更好地认识了变量之间的关系。
本文得到了云南财经大学研究生创新基金项目(2018YUFEYC001)的资助。
秦 川. 多水平模型在中学生数学考试成绩影响因素分析中的应用Application of Multi-Level Model in the Analysis of Influencing Factors of Mathematics Examination in Middle School[J]. 社会科学前沿, 2019, 08(02): 191-196. https://doi.org/10.12677/ASS.2019.82028