本研究以北京市某大学的本科生为调查对象,通过问卷调查获得大学生非理性网购消费的相关数据,利用Apriori算法挖掘出大学生对“价格”、“累计评论”、“描述相符”等因素看重程度的关联规则,并分别从单因素和综合因素角度分析因素对购买决策的影响。通过建立Logistic回归模型帮助商家制定正确的营销策略,并为大学生购买决策提出建议。结果表明:大学生关注的因素之间存在关联规则,关注一个因素的同时,极大可能会考虑与之强关联的另一个因素;对购买决策有显著性影响的单因素在综合作用时其影响可能会被削弱,也有可能会由正向变为负向。 This research takes undergraduates from a university in Beijing as the survey object, obtains relevant data on irrational online shopping consumption of college students through a questionnaire survey, and uses the Apriori algorithm to mine the association rules that college students attach to different factors like “price”, “cumulative reviews”, “description match”, and analyzes the influence of factors on purchasing decisions from the perspective of single factor and comprehensive factors, and establishes a Logistic regression model. In this way, it can help businesses develop correct marketing strategies and make recommendations for college students’ purchasing decisions. The results show that there are association rules among the factors that college students pay attention to. While paying attention to one factor, they are likely to consider another factor that is strongly related to it; in the analysis of the role of comprehensive factors, the impact of single factors that previously had a significant impact on the purchase decision will change. It may be weakened, or it may change from positive to negative.
本研究以北京市某大学的本科生为调查对象,通过问卷调查获得大学生非理性网购消费的相关数据,利用Apriori算法挖掘出大学生对“价格”、“累计评论”、“描述相符”等因素看重程度的关联规则,并分别从单因素和综合因素角度分析因素对购买决策的影响。通过建立Logistic回归模型帮助商家制定正确的营销策略,并为大学生购买决策提出建议。结果表明:大学生关注的因素之间存在关联规则,关注一个因素的同时,极大可能会考虑与之强关联的另一个因素;对购买决策有显著性影响的单因素在综合作用时其影响可能会被削弱,也有可能会由正向变为负向。
关联规则,Logistic回归分析,卡方检验,购买决策
Ruyin Li, Chan Wu, Qiongyu Hu
School of Mathematics and Physics, North China Electric Power University, Beijing
Received: Feb. 16th, 2022; accepted: Mar. 11th, 2022; published: Mar. 18th, 2022
This research takes undergraduates from a university in Beijing as the survey object, obtains relevant data on irrational online shopping consumption of college students through a questionnaire survey, and uses the Apriori algorithm to mine the association rules that college students attach to different factors like “price”, “cumulative reviews”, “description match”, and analyzes the influence of factors on purchasing decisions from the perspective of single factor and comprehensive factors, and establishes a Logistic regression model. In this way, it can help businesses develop correct marketing strategies and make recommendations for college students’ purchasing decisions. The results show that there are association rules among the factors that college students pay attention to. While paying attention to one factor, they are likely to consider another factor that is strongly related to it; in the analysis of the role of comprehensive factors, the impact of single factors that previously had a significant impact on the purchase decision will change. It may be weakened, or it may change from positive to negative.
Keywords:Association Rule, Logistic Regression Model, Chi-Square Test, Purchase Decision
Copyright © 2022 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
随着网络和电子商务的高速发展,互联网逐渐成为人们日常生活中不可或缺的一部分,网络购物正逐步走向成熟。据《第48次中国互联网络发展状况统计报告》显示,2021年上半年,全国网上零售额达61,133亿元,同比增长23.2%。截止2021年6月,我国网络购物用户规模达8.12亿 [
随着互联网的发展和消费者消费观念的转变,大学生网购时做出购买决策可能受到多维度的影响。根据麦卡锡的4Ps营销理论:产品和价格是影响销售效果的两大核心 [
1) 描述相符(质量和外观)、服务态度、物流速度、付款人数、累计评论、保证金、价格、收藏数、心理满足感对购买决策有影响;
2) 单因素分析时,属性越优良,越有利于做出合理的购买决策。
本研究选取北京市某大学的本科生作为调查对象,于2021年10月发放并回收调查问卷350份,参加调查的同学具有很高的随机性。调查内容主要包括:人口基础结构变量测量,购物过程中各种因素的重要程度,实际购物经历中各种因素与行为的表现。通过用户答题时间、地点、前后答题逻辑剔除无效问卷,最终得到有效问卷319份,有效回收率为91.14%。其中,男生有效问卷132份(41%),女生有效问卷187份(59%);大一年级有效问卷71份(22%),大二年级有效问卷94份(29%),大三年级有效问卷101份(32%),大四年级有效问卷53份(17%)。调查问卷中包含因素对行为结果影响的测量,与研究主题相符合。同时也包括因素的重要性测量。
外因:描述相符(质量和外观)、服务态度、物流速度、付款人数、累计评论、保证金、价格、收藏数;
内因:心理满足感;
据《2015中国网购市场研究报告》 [
基于CGSS学术调查问卷设计,请被调查者结合最近一次的购物经历,对以上指标进行评分。这里采用Likert七级量表法进行结构变量的测量,从1到7分别为“非常不满意、不满意、比较不满意、一般、比较满意、满意、非常满意”七个等级。
冲动消费行为,购买结果。
本文重点研究上述因素对购买决策的影响,购买决策由冲动消费行为和购买结果两项指标反映。
冲动消费行为:来自于问卷“Q23:您在购买过程中是否存在冲动消费(未经过深思熟虑、即刻购买的行为)?” [
购买结果:来自于问卷“Q9:您是否退货或退款?”“退货或退款”赋值为0,“确认收货”赋值为1。
本文选取性别、年级、月生活费、月网购费用、月网购频率、最常用的网购平台、消费观教育经历等7个变量作为基础结构变量。主要变量选取见表1。
维度 | 变量 | 变量解释 |
---|---|---|
基础结构变量 | 性别 | 男、女 |
年级 | 大一、大二、大三、大四 | |
月生活费 | (0, 1000)、[1000, 1500) [1500, 2000)、[2000, 2500) [2500, 3000]、(0, 200] | |
月网购费用 | (200, 400]、(400, 600] (600, 800]、(800, 1200] | |
月网购频率 | <3、3~6、6~9、>9 | |
最常用的网购平台 | 淘宝、京东、拼多多、其它 | |
消费观教育经历 | 有、无 | |
自变量 | 描述相符(质量和外观)、服务态度、物流速度、付款人数、累计评论、保证金、价格、收藏数、心理满足感 | 非常不满意 = 1、不满意 = 2、比较不满意 = 3、一般 = 4、比较满意 = 5、满意 = 6、非常满意 = 7 |
因变量 | 冲动消费行为 | 存在冲动消费 = 0 不存在冲动消费 = 1 |
购买结果 | 退货或退款 = 0 确认收货 = 1 |
表1. 相关变量的描述性统计及赋值说明
信度效度检验是针对问卷中量表题型进行的分析。问卷中设置了量表类题型,让被调查者回忆最近一次购物经历,对购物经历中九个方面进行评价。采用Likert七级量表法进行结构变量的测量,即“1”代表“完全不满意”,“7”代表“完全满意”。由于人为评分具有主观性,为了验证调查问卷的精确性和可靠性,需要对此类题型作信度检验和效度检验。
信度分析是指问卷测量结果的可靠性和内部一致性程度。本文以Cronbach’s α系数作为指标来检验数据信度是否达标 [
Cronbach’s α | 项数 |
---|---|
0.885 | 9 |
表2. 可靠性统计
项目 | 删除项后的Cronbach’s α |
---|---|
描述相符(质量和外观) | 0.873 |
服务态度 | 0.876 |
物流速度 | 0.875 |
付款人数 | 0.874 |
累计评论 | 0.869 |
保证金 | 0.878 |
价格 | 0.868 |
收藏数 | 0.869 |
心理满足感 | 0.875 |
表3. 项总计统计
由上表可知,调查问卷总量表和各维度的Cronbach’s α检验值均在0.8以上,说明问卷可信度较高。
效度分析是指检验问卷能够在多大程度上反映它所测量的事项。本文利用因子分析测量量表的结构效度。首先要检验数据是否满足因子分析的前提条件,反映在KMO值和Bartlett球形检验值两个指标上。KMO值可用于比较各项之间简单相关系数和偏相关系数,取值在0到1之间,若大于0.6说明比较适合,且数值越大越好。Bartlett球形检验值可用来检验各项间相关系数是否显著,若Sig值小于0.05,则认为相关性显著。SPSS结果如表4和表5。
检验项目 | 取值 | |
---|---|---|
取样足够的KMO | 0.904 | |
Bartlett球形检验 | χ2 | 1243.030 |
df | 36 | |
Sig. | 0.000 |
表4. KMO和Bartlett检验
从表4看出,本问卷量表KMO检验值为0.904,非常适合做因子分析。Bartlett球形检验值0.000,小于0.05,题项间相关系数显著。
因子分析旋转方法选用最大方差法,选项中缺失值按列表排除个案,系统显示格式按大小排序,取消小系数,绝对值设置为0.5。
数量 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
心理满足感 | 0.846 | ||||
描述相符度 | 0.830 | ||||
付款人数 | 0.867 | ||||
收藏数 | 0.699 | ||||
累计评论 | 0.510 | 0.513 | |||
保证金 | 0.883 | ||||
价格 | 0.617 | ||||
物流速度 | 0.894 | ||||
服务态度 | 0.820 |
表5. 旋转后的成分矩阵
系统将9个量表分为5个因子,其中可以将心理满足感、描述相符度表述为期望因子,付款人数、收藏数、累计评论表述为人气因子,保证金、价格表述为价格保障因子,物流速度表述为物流因子,服务态度表述为服务因子。所有项目均在某个维度起到了作用,说明问卷中所有量表项目都是有效的。
对有效问卷进行统计,统计所调查大学生样本中的基础变量结构特征如表6;此外,把319条数据中影响因素的排序按从高到低赋值[7, 6, 5, 4, 3, 2, 1],并分别对所有因素被赋予的数值求和,从而反映出大学生眼中各个影响因素的重要程度。具体结果如图1。
类别 | 样本特征 | 频率 | 占比 |
---|---|---|---|
性别 | 男 | 132 | 0.41 |
女 | 187 | 0.59 | |
年级 | 大一 | 71 | 0.22 |
大二 | 94 | 0.29 | |
大三 | 101 | 0.32 | |
大四 | 53 | 0.17 | |
月生活费 | [0, 1000) | 22 | 0.07 |
[1000, 1500) | 111 | 0.35 | |
[1500, 2000) | 91 | 0.29 | |
[2000, 2500) | 48 | 0.15 | |
(2500, 3000] | 47 | 0.15 | |
月网购费用 | (0, 200] | 93 | 0.29 |
(200, 400] | 97 | 0.30 | |
(400, 600] | 86 | 0.27 | |
(600, 800] | 24 | 0.08 | |
(800, 1200] | 19 | 0.06 | |
月网购频率 | <3 | 37 | 0.12 |
3~6 | 159 | 0.50 | |
6~9 | 55 | 0.17 | |
>9 | 68 | 0.21 | |
最常用的网购平台 | 淘宝 | 253 | 0.79 |
京东 | 11 | 0.03 | |
拼多多 | 44 | 0.14 | |
其他 | 11 | 0.03 | |
消费观教育经历 | 有 | 151 | 0.47 |
无 | 168 | 0.53 |
表6. 基本结构变量统计表
图1. 大学生对各种因素的综合看重程度
为了挖掘大学生对不同因素看重程度的关联性,充分利用数据价值,筛选出每个大学生最看重的四个因素。我们选用Apriori算法挖掘其中的关联规则,该算法以概率为基础挖掘布尔型关联规则频繁项集,采用逐层迭代的方法,利用频繁项集的所有非空子集也一定是频繁的先验性质,由连接和剪枝两步组成。 L k 为频繁k项集的集合,用 L k 找出 L k + 1 。在频繁项集 L k + 1 中产生强关联规则,找出这些集合有助于我们做一些决策 [
基于Apriori算法,本研究利用Python对上述数据集进行关联规则挖掘,挖掘各指标间具有60%以上支持度和55%以上置信度的深层联系,依据前项、后项关系见表7。
序号 | 关联规则 | 支持度 | 置信度 |
---|---|---|---|
1 | 价格→累计评论 | 0.69 | 0.59 |
2 | 价格→描述相符 | 0.89 | 0.75 |
3 | 累计评论→价格 | 0.87 | 0.59 |
4 | 累计评论→描述相符 | 0.86 | 0.58 |
5 | 描述相符→价格 | 0.83 | 0.75 |
6 | 描述相符→累计评论 | 0.64 | 0.58 |
表7. 筛选出的关联规则
以规则1为例,所有样本中,有69%的大学生同时重视价格和累计评论,重视价格的大学生中有59%也重视累计评论,以此类推。由此可知,上述因素之间都具有强关联性。该结论与文献 [
为了分析因素与行为之间的相关性,用卡方检验分别判定实际购物过程中各种因素对是否退款,是否冲动消费有无显著影响。
卡方检验是一种常用的假设检验方法,属于非参数检验,根本思想在于比较理论频数和实际频数的吻合程度或拟合优度问题。偏离程度越大,卡方值就越大,理论频数就越不符合实际频数;偏离程度越小,卡方值就越小,理论频数就越符合实际频数;当实际频数与理论频数完全相等时,卡方值为0,表明理论频数完全符合实际频数。检验过程中,皮尔逊卡方值小于0.05即认为二者有显著性关系。通过引入卡方检验的基本思想,将每个因素以及是否退款,是否冲动消费进行差异性检验,从而分析出对因变量有显著性作用的单自变量。
依据表8和表9可知,描述相符(质量和外观)、服务态度、收藏数、心理满足感对是否退款有显著影响;描述相符(质量和外观)、服务态度、保证金、价格、收藏数、心理满足感对是否冲动消费有显著影响。
描述相符(质量和外观) | 服务态度 | 物流速度 | 付款人数 | 累计评论 | 保证金 | 价格 | 收藏数 | 心理满足感 | |
---|---|---|---|---|---|---|---|---|---|
皮尔逊卡方 | 0.000 | 0.013 | 0.395 | 0.447 | 0.791 | 0.946 | 0.628 | 0.003 | 0.000 |
似然比 | 0.000 | 0.007 | 0.414 | 0.418 | 0.681 | 0.952 | 0.575 | 0.004 | 0.000 |
线性关联 | 0.000 | 0.912 | 0.014 | 0.088 | 0.629 | 0.745 | 0.085 | 0.012 | 0.000 |
表8. 各种影响因素与是否退货退款的卡方检验
描述相符(质量和外观) | 服务态度 | 物流速度 | 付款人数 | 累计评论 | 保证金 | 价格 | 收藏数 | 心理满足感 | |
---|---|---|---|---|---|---|---|---|---|
皮尔逊卡方 | 0.000 | 0.001 | 0.332 | 0.059 | 0.095 | 0.009 | 0.002 | 0.015 | 0.000 |
似然比 | 0.000 | 0.000 | 0.308 | 0.063 | 0.090 | 0.009 | 0.002 | 0.013 | 0.000 |
线性关联 | 0.000 | 0.000 | 0.006 | 0.001 | 0.004 | 0.000 | 0.000 | 0.000 | 0.000 |
表9. 各种影响因素与是否冲动消费的卡方检验
在实际消费过程中,大学生需要综合考察各方面因素做出购买决策,综合作用下,各种因素对购买决策影响的强弱可能会发生改变,所以还需挖掘各种因素对是否退款、是否冲动消费的综合作用。
Logistic回归分析是一种常用的线性回归分析模型,常用于数据挖掘与处理,而且常用于结果是二分类变量的多因素分析 [
用SPSS做Logistic二分类回归整体分析所有因素与是否退款,是否存在冲动消费行为的关系。自变量为: x 1 描述相符, x 2 服务态度, x 3 物流速度, x 4 付款人数, x 5 累计评论, x 6 保证金, x 7 价格, x 8 收藏数, x 9 心理满足感。因变量为: y 1 是否退款, y 2 是否冲动消费。
结果如表10。
项目 | B | 显著性 | Exp(B) |
---|---|---|---|
描述相符 | 0.302 | 0.040 | 1.353 |
服务态度 | −0.404 | 0.008 | 0.668 |
物流速度 | 0.175 | 0.222 | 1.192 |
付款人数 | 0.011 | 0.942 | 1.011 |
累计评论 | −0.845 | 0.000 | 0.429 |
保证金 | −0.110 | 0.472 | 0.896 |
价格 | −0.100 | 0.540 | 0.905 |
收藏数 | 0.451 | 0.013 | 1.570 |
心理满足感 | 0.851 | 0.000 | 2.341 |
常量 | 0.550 | 0.457 | 1.733 |
表10. 各影响因素与是否退款的Logistic二分类回归分析
基于上述分析与计算,可得Logistic回归方程为:
ln P 1 1 − P 1 = 0.550 + 0.302 x 1 − 0.404 x 2 + 0.175 x 3 + 0.011 x 4 − 0.845 x 5 − 0.110 x 6 − 0.100 x 7 + 0.451 x 8 + 0.851 x 9
其中,
P ( y 1 = 1 | x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 8 , x 9 ) = P 1
由表10可知,描述相符、服务态度、累计评论、收藏数、心理满足感的回归系数P值小于0.05,为影响是否退款的主要因素,更进一步,描述相符,收藏数、心理满足感对退款具有负向作用;服务态度、累计评论对退款具有正向作用。
项目 | B | 显著性 | Exp(B) |
---|---|---|---|
描述相符 | 0.275 | 0.048 | 1.316 |
服务态度 | 0.179 | 0.172 | 1.196 |
物流速度 | −0.214 | 0.113 | 0.807 |
付款人数 | −0.010 | 0.949 | 0.990 |
累计评论 | −0.414 | 0.007 | 0.661 |
保证金 | 0.376 | 0.013 | 1.456 |
价格 | −0.264 | 0.089 | 0.768 |
收藏数 | 0.104 | 0.527 | 1.109 |
心理满足感 | 0.926 | 0.000 | 2.525 |
常量 | −2.422 | 0.001 | 0.089 |
表11. 各影响因素与是否存在冲动消费行为的Logistic二分类回归分析
基于上述分析与计算,可得Logistic回归方程为:
ln P 2 1 − P 2 = − 2.422 + 0.275 x 1 + 0.179 x 2 − 0.214 x 3 − 0.010 x 4 − 0.414 x 5 + 0.376 x 6 − 0.264 x 7 + 0.104 x 8 + 0.926 x 9
其中,
P ( y 2 = 1 | x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 8 , x 9 ) = P 2
由表11可知,描述相符、累计评论、保证金、心理满足感的回归系数P值小于0.05,为影响是否冲动消费的主要因素,更进一步,描述相符、保证金、心理满足感对冲动消费具有负向作用;累计评论对冲动消费具有正向作用。
综上所述,商家致力于降低退款率时,不应从常规的角度去制定销售策略,例如,商家服务态度好、好评数多,也可能会存在高退款率。由于在所有因素的综合作用下,单变量的作用方向可能发生改变,故商家需要综合考察所有因素,提高描述相符度,收藏数、消费者心理满足感,弱化服务态度、累计评论对商品的影响。
同样对大学生消费群体,在综合考察商品时,应重视描述相符度、保证金、心理满足感,同时适当弱化累计评论对决策的影响。
在当今快速发展的时代浪潮中,越来越多的人选择网络购物。大学生群体作为其中的重要组成部分,具有重要的研究意义。调查分析结果表明,大学生的购买决策取决于内因和外因的共同作用,在这一过程中会受到月生活费、消费观教育、心理需求、商品属性等多种层面的影响,部分大学生在购买后出现退货退款、冲动消费、攀比消费等行为。深入研究这一作用过程,可以构建大学生网购消费决策体系,帮助大学生规避不良行为,树立正确的消费观。
本文结论总结如下:
一、大学生群体对网购中各种影响因素的看重程度有不同的感官。调查显示,首先,大学生普遍比较关注描述相符、价格、累计评论几方面的信息;其次,大学生关注的因素之间存在关联规则,关注一个因素的同时,极大可能会考虑与之强关联的另一个因素,个体与个体之间的考虑内容不尽相同。
二、从单因素作用角度分析,得出了对购买决策有显著性影响的因素,然而实际网购过程中,往往是各种因素相互作用,影响购买决策。由此构建了综合因素作用下的Logistic回归方程。从单因素作用角度分析和从因素综合作用角度分析的结果是不同的。前者中对购买行为影响显著的因素,在后者中影响程度可能会相应地减弱。这也提示我们从更深的层次构建因素对行为决策的作用模型。
本文针对调查结果给出以下建议:
个人层面:大学生消费者应树立正确的消费观,在做出购买决策前,思考对商品的期望属性,明确心理需求。在实际决策时,针对商品类别,结合自身需求,分清主次影响因素,考虑商品的实际属性和自身所能承受的价格区间,力求同时实现心理满足和商品优良。
商家层面:从大学生较关注的因素入手制定营销策略,提升商品描述相符程度,不盲目抬高物价,努力提升评价质量,在此过程中,也需要密切关注因素间的关联影响与综合作用,为消费者提供优良的商品和满意的服务,从而降低退款率,增加收益。
社会层面:形成正确的政策支持与舆论导向,净化网络空间与网络环境,学校应加强对学生的消费观教育,培养学生形成正确的消费理念,使社会形成良好的消费氛围,从源头上扼制冲动消费、超前消费、攀比消费等不良风气。
华北电力大学大学生创新创业训练项目(202109005)。
李如茵,吴 婵,胡琼玉. 大学生网络消费的影响因素研究A Study on the Influencing Factors of College Students’ Online Consumption[J]. 应用数学进展, 2022, 11(03): 1078-1088. https://doi.org/10.12677/AAM.2022.113117