Statistics and Application
Vol. 12  No. 02 ( 2023 ), Article ID: 64959 , 18 pages
10.12677/SA.2023.122057

基于Logistics回归模型的大学生网购与学业成绩的关系研究

胡嘉琪

北京工业大学理学部,北京

收稿日期:2023年3月27日;录用日期:2023年4月17日;发布日期:2023年4月29日

摘要

随着网购行业的快速发展,网购已经成为了人们生活中必不可少的一部分,本文主要研究了大学生网购与学业成绩的关系。本文以问卷调查的方式收集了大学生网购和学业成绩的相关数据,先利用可视化分析,分析了问卷数据反映的直观信息。再用斯皮尔曼相关性分析和逻辑回归的方法找到了对学业成绩有显著性影响的因素,最后总结了大学生网购与学业成绩的关系。结果表明每周浏览购物软件频率、大学期间获校级及以上奖项和自我对学习成就的评价对当代大学生专业课成绩有显著性影响。

关键词

网购,成绩,可视化,斯皮尔曼相关性分析,逻辑回归

Research on Relationship between Online Shopping and Academic Performance of University Students Based on Logistic Regression Model

Jiaqi Hu

Faculty of Science, Beijing University of Technology, Beijing

Received: Mar. 27th, 2023; accepted: Apr. 17th, 2023; published: Apr. 29th, 2023

ABSTRACT

With the rapid development of the online shopping industry, online shopping has become an essential part of people’s lives. This paper focuses on the relationship between online shopping and academic performance of university students. This paper collects data related to online shopping and academic performance of university students by means of a questionnaire survey, and first uses visual analysis to analyse the intuitive information reflected by the questionnaire data. Then, we used Spearman correlation coefficients and logistic regression to find the factors that have a significant influence on academic performance, and finally concluded the relationship between online shopping and academic performance of university students. The results indicate that the frequency of browsing shopping software per week, the awards won at university level and above during university and self-evaluation of academic achievement have significant effects on the performance of contemporary university students in professional courses.

Keywords:Online Shopping, Academic Performance, Visual Analysis, Spearman Correlation Coefficients, Logistic Regression

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

21世纪以来,中国网络购物市场交易规模不断扩张,网络购物用户持续增长,作为网络购物用户中重要组成部分的大学生们也在网络购物交易中充当了十分重要的角色。据中国互联网络信息中心(CNNIC)发布的第48次《中国互联网络发展状况统计报告》:截至2021年6月,我国网民规模达10.11亿,互联网普及率达71.6%。我国网络支付用户规模达8.72亿,占网民整体的86.3%。我国网络购物用户规模达8.12亿,占网民整体的80.3% [1] 。近几年我国网民规模和网络支付用户规模不断扩大,可见网购在消费中的重要地位。在已有的对大学生网购的调查中,我们可以知道大学生占网购消费者中很重要的一部分。大学生的网龄普遍较长,网龄1年以下的网民几乎没有,其中网龄为6~8年的接近1/2 (44.4%),网龄8年以上的占25.3%。曾经有过网络购物经历的大学生占到总体的58%,有购买经历的大学生中男生占52.7%,女生占47.3%。可见网络消费方式在大学生中普及率较高,网络消费的便利性和信息的丰富性使得网络消费在大学生中还有进一步的发展空间 [2] 。

而大学生们作为一个学生最重要的任务依然是完成好自己的学业,有一个优秀的学业成绩,因此我们想要通过研究大学生网购和学业成绩的关系来对大学生网购提出一定参考意见。对学生学业成绩的影响因素分析中,有研究以学生的背景信息(包括个体信息与家庭背景)、学生学术行为(包括学习动机、自主学习时间投入、学习行为习惯、课程出勤率)、学生第二课堂活动参与及投入情况、师生交流(与班主任及任课教师交流的频率)为自变量,以学生的成绩排名为因变量,以探讨影响学生成绩的因素 [3] 。我们参考以往对学习成绩影响因素的研究,选择一定的影响因素进行调查。

同时,网络购物作为近几年来不断兴起,持续高涨的产业受到不少企业的青睐,不少企业尝试涉足网购的领域。同时近几年直播带货的网络消费形式逐渐兴起。直播带货,是直播娱乐行业在直播的同时带货,其形式在不断变化,出现直播带货的原因是电商的兴起,引起一些娱乐行业的人跟进所致及演化而来。因此我们研究关注了直播带货的新型网购形式。并且通过对大学生网购时想法和行为的研究,我们也可以为商家、平台提供一定网购运营建议。

2. 数据可视化

图1,由选项1到选项4,平均每个月网购次数和金额增加,并且网购次数和金额的人数在四个选项分布相似,证明我们调查问卷选项的设置是合理的。由网购次数和金额的人数在四个选项分布规律,我们可以得到调查中50%左右的大学生平均每个月网购次数在2~5次之间,平均每个月网购金额在100~500元之间。

Figure 1. Average number/amount of online purchases per month

图1. 平均每个月网购次数\金额

图2,可以看出参与调查的超50%大学生网购为其主要购物方式,并且90%参与调查的大学生有一定的网购经历。证明网购是当代大学生的主流购物方式。

Figure 2. Average online purchases as a percentage of overall purchases

图2. 平均网购占总体购物的百分比

图3,参与调查的有30%大学生天天都会浏览购物软件,也有15%左右的大学生几乎不浏览购物软件,可见大学生浏览购物软件的情况有一定差异。

图4图5,参与调查的大学生在文具、书籍、化妆品/护肤品、服装/鞋帽/配饰、日用品、电子产品、摆件/挂件、网络虚拟类商品(例如游戏、视频会员充值)均有所涉足,大学生网购种类丰富。其中网购日用品、服装/鞋帽/配饰、化妆品/护肤品的大学生较多,且有41%的大学生网购最多的物品种类是服装/鞋帽/配饰。

图6,大学生消费观的多样性,有的大学生基本网购消费均为必需品,而有的大学生网购消费多为非必需品,但大部分大学生所购必需品大概在50%左右。

图7,调查中的大部分大学生在双十一(或其他大型活动)中网购消费金额基本与平时持平或略多于平时,变化并不明显。可见双十一等活动对大学生的网购消费影响并不大。

Figure 3. Frequency of shopping software browsing per week

图3. 每周浏览购物软件频率

Figure 4. General online shopping categories

图4. 一般网购物品种类

Figure 5. Most types of online shopping products

图5. 最多网购物品的种类

Figure 6. Percentage of total items purchased online that individuals consider essential for themselves

图6. 个人认为自己所网购的必需品占网购总物品的百分比

Figure 7. How many times the amount of money spent online on Double Eleven is the usual amount per month

图7. 双十一(或其他大型活动)网购金额是平时每个月的多少倍

图8图9,发现新兴网购形式——直播购物在当代大学生中已有一定普及,但普及度还不高,并且尝试过直播购物的大学生普遍消费次数和金额也不是很高。大学生对新鲜事物的接受程度还是比较高的,故此可推断直播购物的网购形式只在一定人群中有所涉及,但普及度并不高。

Figure 8. Average number of live shopping trips per month

图8. 平均每个月直播购物次数

Figure 9. Average total amount of live shopping per month

图9. 平均每个月直播购物总金额

图10图11,发现使用最多的三个平台分别是淘宝、京东、拼多多,其中淘宝使用人数最多,几乎参与调查的所有大学生都使用淘宝购物平台。调查中有75%的大学生使用最多的网购平台是淘宝。

Figure 10. Online shopping platforms used

图10. 使用的网购平台

Figure 11. The most used online shopping platform

图11. 使用最多的网购平台

表1,我们对被调查者对平台的排名按照从第一到第八的顺序对其赋分8、7、6、5、4、3、2、1,并对53位被调查者的赋分求平均值,得到七个平台的得分。其中淘宝网购平台的分数接近满分,可见大家对淘宝平台都比较满意。

Table 1. Satisfaction score scale for online shopping platforms

表1. 县对网购平台满意程度得分表

图12,大家主要对网购平台不太满意的方面分别是商品质量、售后服务、个人信息安全性、物流和客服服务,可见网购平台还需要在这些方面进行完善,更好的提高平台的品质,让客户满意。

Figure 12. Areas of dissatisfaction with online shopping platforms

图12. 对网购平台不满意的方面

图13,由选项1到选项4,平均每周点外卖或在外面吃饭的次数和金额增加,并且点外卖或在外面吃饭次数和金额的人数在四个选项分布相似,证明我们调查问卷选项的设置是合理的。由点外卖或在外面吃饭次数和金额的人数在四个选项分布规律,我们可以得到调查中70%左右的大学生平均每周点外卖或在外面吃饭的次数在1~4次之间,平均每周点外卖或在外面吃饭的金额在50~500元之间。由于我们调查的大学生90%左右居住地为北京,我们可以得到北京大学生的平均每周点外卖或在外面吃饭的消费水平。

Figure 13. Number of takeaway orders or eating out per week\amount

图13. 每周点外卖或在外面吃饭的次数\金额

图14图15,大学生基本学习完成度是比较高的有超过50%的人能基本保证百分百出勤率和百分百作业完成率。

Figure 14. Usual class attendance

图14. 平时上课出勤率

Figure 15. Completion rate of usual assignments (completed independently)

图15. 平时作业完成率(独立完成)

图16图17,大学生有一定自觉学习的意识,但自觉性还需提高。虽然有一些与老师互动情况比较好和自习时长比较长的学生,但是总体情况偏差。

Figure 16. Interaction with teachers

图16. 与老师互动情况

Figure 17. Average daily self-study hours

图17. 平均每日自习时长

图18,大学生在课外学习方面还比较少,需要更多的提升。

Figure 18. Number of awards received at university level/provincial level or above during university

图18. 大学期间获校级\省级及以上奖项数目

图19,被调查大学生自我对学习成绩的认识和实际的专业成绩排名分布基本相似,可见大家对自己的学习评价还是比较客观的。

Figure 19. Comparison of self-evaluation of academic achievement and professional performance ranking

图19. 自我对学习成就评价和专业成绩排名的对比

3. 研究对学业成绩有显著性影响的因素

3.1. Spearman系数相关性分析

由于我们的数据为非正态的,并且有一组数据为等级类型,所以我们选择斯皮尔曼系数进行相关性分析(以下具体符号含义见表2)。

Table 2. Definition and description of symbols

表2. 符号定义与说明

X和Y为两组数据,其斯皮尔曼(等级)相关系数 [4] :

r s = 1 6 i = 1 n d i 2 n ( n 2 1 )

其中, d i X i Y i 之间的等级差。可以证明: r 位于−1和1之间。

另外,计算显著性p值来检验变量之间是否存在统计上的显著性关系:

我们研究问题5平均每个月网购次数、问题6平均每个月网购总金额、问题7平均网购占总体购物的百分比、问题8每周浏览购物软件频率、问题9一般网购物品种类、问题10最多网购物品的种类、问题11个人认为自己所网购的必需品占网购总物品的百分比、问题14平均每个月直播购物次数、问题15平均每个月直播购物总金额、问题20每周点外卖或在外面吃饭的次数、问题21每周点外卖或在外面吃饭的金额、问题22平时上课出勤率、问题23平时作业完成率(独立完成)、问题24与老师互动情况、问题25平均每日自习时长、问题26专业成绩排名、问题27大学期间获校级及以上奖项数目、问题28大学期间获省级及以上奖项数目、问题29自我对学习成就的评价之间的相关性。

图表说明:图20展示了热力图的形式展示了相关系数的值,主要通过颜色深浅去表示值的大小。

Figure 20. Spearman correlation coefficient heat map

图20. Spearman相关系数热力图

图20展示了热力图的形式展示了相关系数的值,主要通过颜色深浅去表示值的大小。

当p < 0.05,变量之间存在统计上的显著性。见图20表3,我们可以看到问题26。专业成绩排名与问题9。一般网购种类、问题23。平时作业完成率(独立完成)、问题25。平均每日自习时长、问题27。大学期间获校级及以上奖项数目、问题28。大学期间获省级及以上奖项数目、问题29。自我对学习成就的评价具有强相关性 [5] 。

Table 3. Correlation coefficients and significance p-values for other questions and question 26

表3. 其他问题与问题26的相关系数和显著性p值

注:******分别代表1%、5%、10%的显著性水平;括号中的数为显著性p值。

得出结论:

1) 学生一般网购种类为书籍和文具与专业成绩排名有负相关性,p = 0.018;

2) 学生平时作业完成率(独立完成)与专业成绩排名有负相关性,p = 0.042;

3) 学生平均每日自习时长与专业成绩排名有负相关性,p = 0.011;

4) 学生大学期间获校级及以上奖项数目与专业成绩排名有负相关性,p = 0;

5) 学生大学期间获省级及以上奖项数目与专业成绩排名有负相关性,p = 0.002;

6) 学生自我对学习成就的评价与专业成绩排名有正相关性,p = 0。

3.2. 似然比卡方检验

我们使用似然比卡方检验的方法挑选logistic回归模型的自变量。由于调查中的大学生居住地大多是一线城市,二三线城市数据不足,因此为了控制调查中大学生基本信息,防止消费水平对网购产生影响,我们删去了居住地为二三线城市的数据。为避免漏掉一些重要因素,我们把显著性p值的限制条件由p < 0.05放宽为p < 0.1,即问题6、问题7、问题8、问题9、问题23、问题25、问题27、问题29作为自变量。(由于问题28非零数据太少,不适应作为变量进行讨论,故以下数据处理删除问题29)然后,我们对其计算似然比卡方值χ2及p值,

X 2 = i = 1 n ( Q i E i ) 2 E i

注: Q i 是观察数据, E i 是期望数据。

得到:

表4,可知p < 0.05,则水平上呈现显著性,说明模型有效。

Table 4. Model evaluation form

表4. 模型评价表

注:******分别代表1%、5%、10%的显著性水平。

3.3. Logistics回归分析

由以上似然比卡方检验,我们以问题26.专业成绩排名作为因变量,p < 0.1的问题6、问题7、问题8、问题9、问题23、问题25、问题27、问题29作为自变量,建立logistic回归模型。

由于问题26。专业成绩排名中前5%、50%~80%和80%~100%的学生比例过少,故我们将问题26的五个选项重新划分为两个选项,即前20%和20%~100%。在对其进行分类逻辑回归。

Table 5. Basic summary table of multicategorical dependent variables

表5. 多分类因变量基本汇总表

注:选项:当前字段数据下的去重类别;频数:当前去重类别在数据中出现的次数;百分比:当前去重类别的频数占比。

表5所示,由于我们的因变量共有两个选项,即为二类别因变量,设为问题26选择选项20%~100%的概率,为因变量问题6、问题7、问题8、问题9、问题23、问题25、问题27、问题28、问题29,建立多项logistic回归方程 [6] :

log e ( 1 p 1 p 1 ) = α 1 + β 1 X 1 + β 2 X 2 + + β 9 X 9

Table 6. Multi-category logistic regression results table

表6. 多分类逻辑回归结果表

注:******分别代表1%、5%、10%的显著性水平。

注:OR值(优势比):为实验组的事件发生概率/对照组的事件发生概率。

对于连续自变量的OR值的意义为:该变量每升高一个单位,发生实验组事件的概率比发生对照组事件的概率变化了(OR值−1)%。

对于哑变量化的0~1分类自变量的OR值意义为:该变量每升高一个单位(即分类水平从0变为1),发生实验组事件的概率比发生对照组事件的概率变化了(OR值−1)% [7] 。

表6,二分类逻辑回归的结果显示:

常数显著性p值为0.029**,因此常数会对问题26产生显著性影响,意味着常数每增加一个单位,问题26为选项2的概率比选项1的概率低了100.0%。

问题8显著性p值为0.026**,因此问题8会对问题26产生显著性影响,意味着问题8每增加一个单位,问题26为选项2的概率比选项1的概率高了283.662%。

问题27显著性p值为0.025**,因此问题27会对问题26产生显著性影响,意味着问题27每增加一个单位,问题26为选项2的概率比选项1的概率低了57.699%。

问题29显著性p值为0.014**,因此问题29会对问题26产生显著性影响,意味着问题29每增加一个单位,问题26为选项2的概率比选项1的概率高了4763.409%。

4. 结论

综上所述,通过大学生网购与学业成绩的关系调查数据,基于逻辑回归模型,分析了影响大学生专业课成绩的几种因素。通过研究,对当代大学生专业课成绩有明显的影响的因素是每周浏览购物软件频率、大学期间获校级及以上奖项和自我对学习成就的评价。

可见大学生的时间精力是有限的,如果把过多精力浪费在浏览购物软件上,容易导致放在学业任务上的精力不足,从而导致学业成绩出现问题,因此建议大学生要分配好自己的时间精力,不要过度沉迷于网购。另外对于大学生来说,课外的一些综合发展和课内的专业成绩是同样重要的,我们也可以通过调查发现课内学业成绩好的大学生在大学期间参与比赛获奖情况也是比较优秀的。此外,在当代内卷环境严重的情况下,在不停的对比下大学生容易产生自卑的情绪,但通过研究我们发现大学生对自我的评价也对其学业成绩有着密切的关系。

综合大学生对网购平台满意度调查,我们建议网购平台严格检查商品质量,在保证商品质量的基础上,关注售后服务、个人信息安全性、物流和客服服务,保护客户的个人信息,防止泄露,在服务方面保持一个良好的态度,并高效解决客户的售后和物流问题。

基金项目

北京工业大学星火基金XH-2022-05-06。

文章引用

胡嘉琪. 基于Logistics回归模型的大学生网购与学业成绩的关系研究
Research on Relationship between Online Shopping and Academic Performance of University Students Based on Logistic Regression Model[J]. 统计学与应用, 2023, 12(02): 525-542. https://doi.org/10.12677/SA.2023.122057

参考文献

  1. 1. 中国互联网络信息中心. 第48次中国互联网络发展状况统计报告[R]. 2021.

  2. 2. 薛红燕, 纪锋. 大学生网络消费行为的实证研究[J]. 哈尔滨商业大学学报(社会科学版), 2011(2): 23-27.

  3. 3. 孙睿君, 沈若萌, 管浏斯. 大学生学习成效的影响因素研究[J]. 国家教育行政学院学报, 2012(9): 65-71.

  4. 4. 笨牛慢耕. 斯皮尔曼相关系数概述及其计算例[EB/OL]. http://t.csdn.cn/s7hy4, 2023-02-10.

  5. 5. 徐维超. 相关系数研究综述[J]. 广东工业大学学报, 2012, 29(3): 12-17.

  6. 6. 司守奎, 孙兆亮. 数学建模算法与应用[M]. 北京: 国防工业出版社, 2015: 150-156.

  7. 7. 袁翔宇, 张蓬鹤, 熊素琴, 等. 基于逻辑回归算法的异常用电辨识方法研究[J]. 电测与仪表, 2021, 58(12): 81-87.

附录

大学生网购与学业成绩的关系调查

期刊菜单