Advances in Psychology
Vol. 13  No. 10 ( 2023 ), Article ID: 74031 , 10 pages
10.12677/AP.2023.1310569

贝叶斯网在教育测量与因果推断中的应用

——以青少年“王者荣耀”网游消费决策为例

陈彦垒1,王其鹏1,2

1聊城大学教科院,山东 聊城

2江西师范大学心理学院,江西 南昌

收稿日期:2023年8月23日;录用日期:2023年10月11日;发布日期:2023年10月19日

摘要

贝叶斯网解决了回归技术无法处理的复杂环境下多模态数据处理,可以正向和逆向推断因果关系,将不确定性因果关系推断具象化,逐渐成为人工智能时代变量因果关系研究的关键工具。在教育测量上,贝叶斯网建立层级结构的概率模型,将先验概率和后验概率结合,提高了认知诊断的准确性,提升了计算机自适应测验的效率和效能。在因果推断上,贝叶斯网可以清晰地展现多模态数据下,多个自变量和多个因变量之间的关系,不仅突破了回归分析的局限,也使变量之间的依赖关系更加明确,使得因果推断和不确定性决策的科学性得到明显提高。采用贝叶斯网完成了516名青少年玩家“王者荣耀”消费决策影响因素的估计,发现大五人格、游戏体验、收藏偏好、产品外观和产品价格对游戏消费决策有不同的预测作用。目前贝叶斯网的概率繁殖算法还需改进,运用海量数据的结构学习和推理的问题解决方案仍存在不足,动态贝叶斯网和贝叶斯网的应用领域还需要不断扩展。

关键词

贝叶斯网,教育测量,因果推断,人工智能,网络游戏消费

The Educational Measurement and Causal Inference Based on Bayesian Network

—Taking the Online Game Consumption Decision of “King of Glory” as an Example

Yanlei Chen1, Qipeng Wang1,2

1Faculty of Education Science College, Liaocheng University, Liaocheng Shandong

2School of Psychology, Jiangxi Normal University, Nanchang Jiangxi

Received: Aug. 23rd, 2023; accepted: Oct. 11th, 2023; published: Oct. 19th, 2023

ABSTRACT

Bayesian network can solve multi-modal data processing in complex environments that cannot be processed by regression technology, and it can infer causality in both forward and reverse directions, and visualize the causal inference of uncertain, which has gradually become a key tool for the research on the era variable causality of artificial intelligence. In terms of educational measurement, Bayesian network establishes a hierarchical probability model, combines prior probability with posterior probability, improves the accuracy of cognitive diagnosis, and improves the efficiency and efficiency of Computer Adaptive Test. In terms of causal inference, Bayesian network can clearly show the relationship between multiple independent variables and multiple dependent variables in multi-modal data, which not only breaks through the limitation of regression analysis, but also makes the dependence between variables more clear, which significantly improves the scientific nature of causal inference and uncertain decision-making. At present, the probabilistic propagation algorithm of Bayesian network still needs to be improved, and the solution to the problem of structural learning and reasoning based on massive data still needs to be improved. The application fields of dynamic Bayesian network and Bayesian network need to be expanded continuously.

Keywords:Bayesian Network, Educational Measurement, Causal Inference, Artificial Intelligence, Cybergame Consumption

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

网络游戏从一种娱乐工具变成了青少年生活方式的组成部分。中国青少年网络游戏行为与保护研究报告指出,青少年玩游戏的比例随年龄呈线性增长,21.3%网游青少年游戏消费月支出在100元以上。国家新闻出版署发布了《关于防止未成年人沉迷网络游戏的通知》,明确了网游企业付费服务标准:8~16周岁的未成年人用户,单次充值金额不得超过50元人民币,每月充值金额累计不得超过200元人民币;16周岁以上的未成年人用户,单次充值金额不得超过100元人民币,每月充值金额累计不得超过400元人民币。

单纯的政策规定仅能从形式上约束青少年网游消费,如果将影响网络游戏消费行为的因素与贝叶斯网络结合起来,不仅能完成对影响因素的探索,还可对因素之间的逻辑关系进行分析,最终实现对青少年网络游戏消费时心理加工过程的测量与诊断。

2. 贝叶斯网络

贝叶斯网络模型(Bayesian Networks,BN,简称贝叶斯网)是基于贝叶斯数学公式形成的概率模型,可以用来表示各种因果效应关系,但不仅局限于表示因果效应关系,它适用于表达和分析那些不确定性的科学事物,能够从不完全、不精确或不完全确定的科学知识或技术信息中快速做出有效的信息推理,是目前不确定性知识表达和信息推理分析领域最有效的分析工具之一(宋丽红等,2016)。

贝叶斯网络由两个大部分组成:有向无环图(Directed Acyclic Graph, DAG)和条件概率分布(Conditional Probability Distribution, CPD),其中有向无环图主要描述了贝叶斯网络结点之间的各种定性关系,条件概率分布则描述了贝叶斯网络结点之间的各种定量关系(黄影平,2013)。图1和下面的这个例子共同说明了一个简单的贝叶斯网络,所有的结点均可视为二值函数结点。

Figure 1. Simple Bayesian network

图1. 简单贝叶斯网络

图1中有四个结点和四条弧。普通感冒A1和新型流感A2是原因节点,它两个都有可能导致病人发烧A3,在特殊疫情情况下,都会被进行隔离治疗。另外如果直接检测出病人患有新型流感A2,即使没有发烧症状,也会被隔离治疗。这就是一个简单的贝叶斯网络的基本结构。在贝叶斯网中像A1这样没有输入的结点被称作根结点(root),其他结点被统称为非根结点。

贝叶斯网络当中的弧表达了结点间的逻辑关系,如果两个结点间有弧连接说明两者之间有一定的逻辑关系,例如A1有可能导致A3。反之如果两个变量之间没有直接相连,则说明两者之间存在逻辑关系的可能性极小,是相互独立的。结点间的相互独立关系是贝叶斯网络当中很重要的一个属性,可以大大减少在构建贝叶斯网络过程当中的计算量。此外,根据独立关系来使用贝叶斯网络也是一个重要的方法,使用贝叶斯网络结构可以使人清晰地得出属性结点间的关系,也使得用贝叶斯网进行推理和预测变量间的关系变得相对容易实现。

就如上面例子所表明的,贝叶斯网络在解决不确定问题上具有明显的优势,它能将变量之间普通的相关关系通过有向环图形成逻辑关系,还利用概率分布确定了变量之间的权变关系,从而将共变变成了权变。下文通过贝叶斯网络在教育测量和因果推断两个领域中的应用,来论证贝叶斯网络在处理不确定性问题上的明显优势。

3. 基于贝叶斯网络的教育测量和因果推断

(一) 基于贝叶斯网络的教育测量

教育离不开考试,教育测量在中国的现代教育中扮演着举足轻重的地位,也正因如此,众多学者在发现目前教育测量的不足之后,竭尽全力提出改进措施。目前国内使用的测验大多还是以传统测量理论(CTT)为理论支撑进行编制的,这种教育测验的缺点非常明显,虽然通过测验,教师可以知道学生确定的成绩和题目的对错,但是学生在做测量时的知识状态和认知过程是不确定的,教师也无从得知。为解决这种不确定性问题,专家们将贝叶斯网络引入教育测量领域(Vomlel, 2008

1) 贝叶斯网络的分类器

教育测量的前期工作就是进行认知诊断,为了编制更适合学生的测验,需要更准确的认知诊断。贝叶斯网络分类器能够很好地提高认知诊断的准确性(喻晓锋,丁树良,秦春影,2012),目前贝叶斯网络分类器的软件种类还比较多,其中最为简单和实用的一类是朴素贝叶斯网络分类器。朴素贝叶斯网分类器是最简单的贝叶斯网络分类器,它有两个明显的优点:第一是容易构造,因为结构是已知的,所以不需要进行结构学习;第二是分类非常有效(宋丽红,2012)。

2) 利用朴素贝叶斯网分类器进行认知诊断

图2显示了朴素贝叶斯网分类器的基本结构。可以这样理解这种贝叶斯网分类器:假设一个测验中共有n个项目,被试对这n个项目进行作答,得到 B 1 , B 2 , B 3 , , B n 这列数据,表示n个项目的作答情况或得分(即贝叶斯网分类器中的属性节点), B 1 , B 2 , B 3 , , B n 的不同值的组合对应了不同的作答情况。C的不同状态对应了不同的知识掌握情况(同时也对应了 B 1 , B 2 , B 3 , , B n 的不同值的组合),即贝叶斯网分类器中的类结点集合,C中不同的知识掌握情况(即知识状态,knowledge state)通过专家意见或历史数据可以得到其先验概率,即所属类别结点的先验概率(邓甦,付长贺,2008)。

Figure 2. Bayesian network classifier

图2. 朴素贝叶斯网分类器

利用朴素贝叶斯网分类器进行分类的具体过程如下:已知 B 1 , B 2 , B 3 , , B n 的值,对所有i计算 P ( C i / B 1 , B 2 , B 3 , , B n ) ,带入贝叶斯公式和全概率公式:

P ( C i | B 1 , B 2 , , B n ) = P ( B 1 , B 2 , , B n | C i ) P ( C i ) P ( B 1 , B 2 , , B n ) = P ( B 1 , B 2 , , B n | C i ) P ( C i ) i = 1 k P ( B 1 , B 2 , , B n | C i ) P ( C i )

其中 P ( C i ) 为先验概率。因为在给定节点C的条件下, B 1 , B 2 , B 3 , , B n 是独立的,由概率论得出: P ( B 1 , B 2 , B 3 , , B n / C i ) = P ( B j / C i )

代入公式后,计算出样本属于各类的后验概率值,寻找使 P ( C i / B 1 , B 2 , B 3 , , B n ) 达到最大时Ci的取值,此时的Ci即为待分类样本所对应的类,也就是被试的知识状态,结果就是应用朴素贝叶斯网分类器实现了认知诊断(Cheng & Greiner, 2013)。

3) 贝叶斯网络在不同形式测验上的应用

贝叶斯网络除了用于认知诊断,还可以用于编制测验,无论是传统的纸笔测验还是计算机自适应测验(CAT),贝叶斯网络都能给予很大的帮助。

贝叶斯网络对于纸笔测量的帮助主要在于贝叶斯网络考虑到了所要测量的所有技能或者知识点之间的依赖性或者逻辑性。例如,用一个测验去测量3种技能S1,S2,和S3掌握与否(用1表示掌握,用0表示未掌握),测量包含3道题目,X1,2,X1,3和X2,3,答对每道题目必须同时具备两种技能或者掌握两种知识点,例如要答对X1,2就必须要掌握S1和S2,其余类推(余嘉元,汪存友,2005)。

在传统的教育测量中,通常并没有考虑到各种技能之间的依赖性,并且假设它们之间是相互独立互不影响的,如果考生3道题目都答错了,教师并没有办法知道考生究竟对哪些技能没有掌握。但是如果用贝叶斯网络来分析问题的话,首先就要考虑各种技能之间的逻辑性和依赖性,假设根据相关知识得到:S1—S2,S2—S3,而且已知P(S1) = 0,P(S2 = 0/S1 = 0) = 0.5,P(S3 = 0/S1 = 0) = 0.5,那么可以推导出:

P ( S 1 = 0 / X 1 , 2 = 0 , X 1 , 3 = 0 , X 2 , 3 = 0 ) = 1 ;

P ( S 2 = 0 / X 1 , 2 = 0 , X 1 , 3 = 0 , X 2 , 3 = 0 ) = 1 ;

P ( S 3 = 0 / X 1 , 2 = 0 , X 1 , 3 = 0 , X 2 , 3 = 0 ) = 0.5.

于是可以得出结论,该学生不具有技能S1和S2,具备技能S3的概率为0.5。由此可以看出,运用贝叶斯网络编制教育测验可以得到更多的信息。这样的测验更能让老师了解学生的知识掌握情况和学习过程,真正做到因人而异,因材施教。

用贝叶斯网络构建计算机自适应测验是一个复杂的过程,在这里可以先用一个简单地贝叶斯网络演示,如图3所示,先让学生做第一个问题X2,没有答对,下一个题目就是X1,这个题目比X2简单;如果X2答对了,下个题目将会变成X3,这个题目比X2困难。一系列题目构成一个自适应测验。这种自适应测验优点在于它的动态变化,不同的学生的作答情况不同,教师能够通过这结果清楚地知道学生知识的掌握情况,达到教学的针对性。

Figure 3. Computer adaptive test

图3. 计算机自适应测验

(二) 基于贝叶斯网络的因果推断

在因果推断领域中,贝叶斯网可以清晰地展现在多模态数据下,多个自变量和多个因变量之间的关系,不仅突破了回归分析的局限,也使变量之间的依赖关系更加明确,使得在进行因果推断和不确定性决策时科学性得到明显提高。

对于如何用贝叶斯网络解决不确定性决策问题,下文举一个案例来简要介绍一下,方便读者理解(胡笑旋,2006)。

玩家在进行网络游戏消费决策的时候会受到很多因素的影响,假设这些因素分别是性别,年龄,价值观,消费产品的外观,游戏体验。对这些自变量以及因变量的操作定义如下:

① 性别:分为男性和女性。

② 年龄:分为12~15岁,16~18岁,19~22岁,22岁以上。

③ 价值观:被试对产品价格的主观感受,分为觉得价格偏高,觉得价格适中。

④ 产品外观:游戏消费产品的外观是否漂亮帅气,分为漂亮和不漂亮。

⑤ 游戏体验:玩游戏的舒适程度,分为提高游戏体验和对游戏体验无影响。

如果能掌握这些因素和消费决策之间的内在关系,就能较为准确的预测玩家的决策行为。现在以贝叶斯网络来建立一个预测模型。

首先,因素之间的关系可以通过专家认定或者问卷调查之类的方法确定,在本案例当中,则通过访谈调查认定确定了这些因素与消费决策之间的内在联系,构建出的贝叶斯网络模型如图4所示:

Figure 4. Initial model of consumption decision prediction problem

图4. 消费决策预测问题的初始模型

图4可知,产品外观,价值观和游戏体验是消费决策的根节点,并且三个变量之间没有逻辑关系。另外年龄和性别也是根节点。在结构学习之后确定上述变量的取值范围:年龄{12~15岁,16~18岁,19~22岁,22岁以上},性别{男,女},产品外观{漂亮,不漂亮},价值观{价格适中,价格偏高},游戏体验{提高游戏体验,无影响},消费决策{决定消费,决定不消费}。使用概率标杆,确定网络中各节点的条件概率分布。并最终得到最终的贝叶斯网络模型(秦立霞,刘桥生,罗涛,2020)。

根据贝叶斯网络模型,如果已知年龄、性别、产品外观、价值观和游戏体验情况,输入的贝叶斯网络模型中,就可以知道消费决策的后验概率,并最终可以判断玩家是否决定消费。

以上就是用贝叶斯网络模型解决不确定性决策问题的具体操作,可以看出用贝叶斯网络解决不确定性决策问题是非常方便的并且准确的。

4. 基于贝叶斯网的青少年网游消费决策分析

考虑到人格特征、游戏体验、收藏偏好、产品外观和产品价格是影响网游消费的五个主要因素。本研究基于“王者荣耀”游戏,调查了516名青少年游戏玩家。采用经典大五人格作为人格的测量工具,并基于后四个因素编制了“王者荣耀”玩家调查问卷,问卷共4个维度12个题目,本研究中的内部一致性信度α系数为0.934。基于上述分析,本研究提出下述假设模型图(见图5)。

Figure 5. Hypothetical model of this study

图5. 本研究假设模型

其中表中的字母的操作定义分别为:

大五人格 游戏四个因素

SY——大五人格中的适应性T——因可以提高游戏体验而决定消费的可能性

SJ——大五人格中的社交性A——因想要收集东西的偏好而决定消费的可能性

KF——大五人格中的开放性W——因产品外观好看而决定消费的可能性

LT——大五人格中的利他性J——因产品价格合适而决定消费的可能性

DD——大五人格中的道德感

研究假设为:

H1:大五人格可以预测玩家的消费决策

H2:游戏体验、收藏偏好、产品外观和产品价格会影响消费决策

在控制性别和年龄两个变量后,进行偏相关检验,分析主要变量之间的相关关系。结果如表1所示,游戏体验、收藏偏好、产品价格和产品外观相关显著,与人格的五个维度相关并不显著。

Table 1. Correlation analysis of each variable

表1. 各变量的相关分析

注:n = 516;*p < 0.05,***p < 0.01。

通过R语言对贝叶斯网进行了结构学习和参数学习,得到最终的贝叶斯网络(图6所示)。

Figure 6. Bayesian networks that influence network consumption decisions

图6. 影响网络消费决策的贝叶斯网络

结果发现,大五人格的利他性影响到其他网游消费因素,其他四个维度单独影响网游消费;游戏体验会影响到收藏偏好,收藏偏好会影响玩家对产品价格的感受和对产品外观的评价。

为了方便对结果进行解释,研究将每一个变量都分成三个水平,即低,中,高三个层次。通过贝叶斯网络的参数学习,制作概率分布表,解释各个变量之间的依赖关系。

Table 2. Probability distribution between T and LT

表2. T与LT之间的概率分布

表2可知,当一个玩家的利他性人格倾向比较高的时候,这名玩家因想要提高游戏体验而消费的可能性越大。具体来说就是如果确定一个玩家属于高利他性人格,那么这名玩家有50%的可能会因为想要提高游戏体验而决定购买相关产品。

Table 3. Probability distribution between A and T

表3. A与T之间的概率分布

表3可知,当一个玩家因想要提高游戏体验而决定消费的时候,可以判断这个玩家因想要收集的偏好而决定消费的可能性约为61.5%;如果这个玩家没有因提高游戏体验而决定消费,那么因为收集某款产品的偏好而决定购买产品的可能性为4.9%。

Table 4. Probability distribution between J and A

表4. J与A之间的概率分布

表4可知,当玩家因为收集某款产品的偏好而消费时,玩家有48.6%的可能性因为产品价格合适就决定消费了。

Table 5. Probability distribution between A and W

表5. A与W之间的概率分布

表5可知,当玩家因为收集某款产品的偏好而消费时,玩家有46.8%的可能性因外产品外观好看而决定消费。

由以上几个表可以清楚的了解到变量之间的概率关系,结合有向无环图,可以得到完整的贝叶斯网络。

在本研究中,由于大五人格有五个人格倾向,无法对人格这个变量整体分析,只能将大五人格的五个人格倾向当作五个变量,然后与另外四个变量一起进行分析。这样一来,就变成了九个变量之间的关系研究。如果仍用方差分析,那将会非常麻烦。因此,借助贝叶斯网络进行分析,变量之间的关系就可以明显看出来。不仅如此,贝叶斯网络能利用概率分布表更直观地算出变量之间的数学关系。

5. 研究展望

贝叶斯网络模型在教育测量和风险决策领域中的广泛应用,让越来越多的学者开始关注它,研究它,贝叶斯网络也得以不断完善,它的实际应用将越来越成熟。未来的研究中,贝叶斯网仍需从几个方面进一步完善(王理冬等,2006):

1) 概率繁殖算法的改进。目前贝叶斯网络中概率推理所用的是概率繁殖算法,这种算法对于结点较少的情况下能进行高效的推理,但是如果网络结点数目达到成千上万时,这种繁殖算法就无法处理了。所以,在实际应用中结合问题的特点来寻求大型复杂网络的繁殖算法将是未来研究的一个热点。

2) 运用海量数据的结构学习和推理。相对于其他人工智能工具,例如神经网络和遗传算法,贝叶斯网利用海量数据进行结构学习功能需要进一步加强。

3) 动态贝叶斯网络的扩展研究。目前DBN只局限于描述系统的结点随时间的变化,进一步的研究将扩展到网络结构的动态变化。

4) 在应用研究方面,贝叶斯网将越来越趋于成熟,传统的故障分析(FTA)、事件数分析(ETA)等这些可靠性分析方法都是利用某种近似方法去模拟事情的一个方面,今后这些方法以及类似方法都可以被贝叶斯网络模型取代。另外,由于贝叶斯具有在因果推断和决策等领域具有很大的优势,贝叶斯网络也将逐渐成为在人工智能领域进行不确定推理和建模的一个有效工具。

2020年中国游戏市场实际销售达2786.87亿元,中国网络游戏整体用户规模为6.65亿人。青少年是网络的原住民,2021年以来,主流媒体对网络游戏市场净化、产业转型升级、青少年保护等议题提出了诸多探讨,一方面要促进我国网络游戏产业的健康发展,另一方面要通过网络游戏培养青少年的社会主义核心价值观的认同感。知产财经中文网提出,伴随互联网成长的80后、90后成为社会的中坚力量,公众对网络游戏产业的认知和理解不断加深,加之网络传输技术水平不断优化,云计算及5G等技术的爆发,网络游戏势必迎来新的产业升级。但是网络游戏中,依然存在粗放化的发展,比如粗制滥造、诱导消费、误导价值观等,迫切需要外界监督。由于游戏商业化计划推迟和整体游戏质量水平不足等原因,用户的需求并没有得到充分的满足和挖掘。基于贝叶斯网的网络游戏研究一方面可以通过因果推断为网游产业发展提供智力支持,另一个方面也可以为主管部门净化网络空间提供借鉴(奚婉,胡玉正,2022)。

基金项目

教育部人文社会科学研究青年基金“认知双加工的青少年网络偏差行为控制与网络素养提升研究”(19YJC880011);山东省研究生教育质量提升计划教学案例库建设(sdyal19055);聊城大学横向课题(321/R22WD38)。

文章引用

陈彦垒,王其鹏. 贝叶斯网在教育测量与因果推断中的应用——以青少年“王者荣耀”网游消费决策为例
The Educational Measurement and Causal Inference Based on Bayesian Network—Taking the Online Game Consumption Decision of “King of Glory” as an Example[J]. 心理学进展, 2023, 13(10): 4516-4525. https://doi.org/10.12677/AP.2023.1310569

参考文献

  1. 1. 邓甦, 付长贺(2008). 四种贝叶斯分类器及其比较. 沈阳师范大学学报(自然科学版), 26(1), 31-33.

  2. 2. 胡笑旋(2006). 贝叶斯网建模技术及其在决策中的应用. 博士学位论文, 合肥: 合肥工业大学.

  3. 3. 黄影平(2013). 贝叶斯网络发展及其应用综述. 北京理工大学学报, 33(12), 1211-1219.

  4. 4. 秦立霞, 刘桥生, 罗涛(2020). 网络游戏障碍量表中文版在大学生中的信效度检验. 中国临床心理学杂志, 28(1), 31-36.

  5. 5. 宋丽红(2012). DINA改进模型(R-DINA)的提出及三个诊断模型自动选择机制研究. 博士学位论文, 南昌: 江西师范大学.

  6. 6. 宋丽红, 汪文义, 戴海琦, 等(2016). 基于贝叶斯网的认知诊断模型构建. 心理科学, 39(4), 783-789.

  7. 7. 王理冬, 汪光阳, 程泽凯, 等(2006). 贝叶斯网络的发展与展望. 安徽工业大学学报(自然科学版), 23(2), 195-198.

  8. 8. 奚婉, 胡玉正(2022). 青少年网络游戏成瘾的研究现状与展望. 应用心理学, 28(1), 3-19.

  9. 9. 余嘉元, 汪存友(2005). 贝叶斯网络在教育和心理测量中的应用. 见 中国人工智能学会第11届全国学术年会论文集(上) (pp. 412-415). 中国人工智能学术年会.

  10. 10. 喻晓锋, 丁树良, 秦春影(2012). 朴素贝叶斯网分类器在认知诊断中的应用. 统计与决策, (3), 22-26.

  11. 11. Cheng, J., & Greiner, R. (2013). Comparing Bayesian Network Classifiers. IEEE Transactions on Vehicular Technology, 63, 2002-2012.

  12. 12. Vomlel, J. (2008). Bayesian Networks in Educational Testing. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 12, 83-100. https://doi.org/10.1142/S021848850400259X

期刊菜单