E-Commerce Letters
Vol. 13  No. 01 ( 2024 ), Article ID: 82121 , 7 pages
10.12677/ECL.2024.131051

Poisson分布截尾序贯近似最优检验的研究

——以电子商务产品的抽样检验为例

叶茂越1,胡思贵2,龙荣进1

1贵州大学数学与统计学院,贵州 贵阳

2贵州医科大学生物与工程学院,贵州 贵阳

收稿日期:2024年1月18日;录用日期:2024年1月25日;发布日期:2024年2月29日

摘要

对测量指标服从Poisson分布的电子商务产品进行抽样检验时,为降低抽样检验的试验成本,本文采用样本空间排序法设计Poisson分布计数型截尾序贯近似最优检验方案TS。结果表明,TS方案在保证实际犯两类错误的概率小于给定检验水平的情况下,平均试验次数尽可能达到最小,很好地降低了电子商务产品的抽样检验成本。此外,本文还使用蒙特卡洛法对其准确性进行验证。证实了采用样本空间排序法设计的Poisson分布计数型截尾序贯近似最优检验方案TS具有高可靠性。

关键词

Poisson分布,截尾序贯近似最优检验,样本空间排序法,电子商务产品

Study on Truncated Sequential Approximate Optimal Test of Poisson Distribution

—Taking the Sampling Inspection of E-Commerce Products as an Example

Maoyue Ye1, Sigui Hu2, Rongjin Long1

1School of Mathematics and Statistics, Guizhou University, Guiyang Guizhou

2School of Biology and Engineering, Guizhou Medical University, Guiyang Guizhou

Received: Jan. 18th, 2024; accepted: Jan. 25th, 2024; published: Feb. 29th, 2024

ABSTRACT

In order to reduce the test cost of sampling inspection when sampling inspection of e-commerce products whose measurement indexes obey Poisson distribution, this paper designs a sequential approximate optimal inspection scheme TS with Poisson distribution counting type by using the sample space sorting method. The results show that TS scheme can minimize the average number of tests as much as possible under the condition that the probability of actually making two kinds of mistakes is less than the given inspection level, which greatly reduces the sampling inspection cost of e-commerce products. In addition, this paper also uses Monte Carlo method to verify its accuracy. It is proved that TS, a counting truncated sequential approximate optimal test scheme of Poisson distribution designed by sample space sorting method, has high reliability.

Keywords:Poisson Distribution, Truncated Sequential Approximate Optimal Test, Sample Space Sorting Method, E-Commerce Products

Copyright © 2024 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

随着互联网的迅猛发展,电子商务在国民经济中扮演着日益重要的角色。然而,随之而来的是电子商务产品质量问题层出不穷 [1] [2] 。因此,对电子商务产品进行抽样检验变得尤为必要。这种抽样检验不仅确保了电子商务产品的质量状况,也是为了捍卫消费者的合法权益。在这一背景下,设计一套有效的抽样检验方案显得至关重要。

截尾序贯检验方案指样本量不必事先固定,而是根据抽样过程出现的情况来决定何时停止抽样的检验方法。相较于传统固定试验样本量的抽样检验方案方法,截尾序贯检验能够有效的减少平均试验次数,从而减少抽样检验的试验成本 [3] 。许多学者对截尾序贯检验进行了研究。Lorden [4] 提出了两次序贯概率比检验(简称2-SPRT),在渐近意义下解决Modified Kiefer-Weiss问题。此外,文献 [5] [6] [7] 讨论了2-SPRT的渐近有效性等性质。濮晓龙 [8] 等设计了序贯网图检验。Donnelly [9] 解决了序贯检验无法确保最大样本量问题的截尾序贯检验。张可数 [10] 提出了一种基于Neyman-Pearson型序贯概率比检验方法的截尾序贯检验,并通过模拟说明效果比一般的截尾序贯检验要好。但上述方法所得截尾序贯检验方案并不是最优的,那么什么才是截尾序贯最优检验方案呢?在严格控制犯两类错误的概率不超过给定检验水平的情况下,具有最小的平均试验次数的检验方案才是最优的截尾序贯检验方案。

关于截尾序贯最优检验方案的研究中,马海南 [11] 利用穷举法对序贯样本空间进行了全搜索从而求截尾序贯最优检验。Chang, M.N [12] 则在可容许解范围内进行收索求解出截尾序贯最优检验,但是两种方法都存在搜索工作量很大的问题。胡思贵 [13] 建立样本空间排序法(Sample Space Sorting Method, SSSM),该方法是通过在样本空间逐点优化求解最优方案,避免了对序贯样本空间的全搜索,减小了计算工作量,提高了精确性。胡思贵 [14] 表明,采用SSSM求解的截尾序贯最优检验能严格控制两类错误的概率不超过给定检验水平并且充分利用给定的检验水平,有效地降低试验的平均试验次数。对此,本文将采用样本空间排序法设计测量指标服从Poisson分布的电子商务产品的截尾序贯近似最优检验方案,并采用模拟仿真试验对其准确性和可靠性进行验证。

本文余下内容安排如下:在第2节介绍Poisson分布截尾序贯检验的基本概念定义;在第3节采用样本空间排序法求解截尾序贯近似最优检验方案的具体步骤;在第4节算例分析及模拟仿真;第5节为总结部分。

2. Poisson分布截尾序贯检验

设待检验电子商务产品的测量指标发生次数x服从参数为λ泊松分布,概率密度函数为:

f ( x , λ ) = λ x x ! e λ , ( λ > 0 , x = 0 , 1 , 2 , ) (1)

讨论如下假设检验问题:

H 0 : λ = λ 0 V S H 1 : λ = λ 1 (2)

X i ~ P o i s s o n ( λ ) , i = 1 , 2 , , n 表示第i个电子商务产品测量指标的发生次数,则 S m = i = 1 n X i 表示试

验进行到n个阶段电子商务产品测量指标的累积发生次数,其服从参数为mλ的Poisson分布,称Sm为Poisson分布的序贯计数检验统计量。

现给出参数为λ泊松分布截尾序贯检验方案的定义

定义1设给定两列单调递增整数列 ( A n , R n ) , A n < R n , n = 1 , 2 , , N ,且满足

{ A n + 2 R n n = 1 , 2 , ... , N 1 A N + 1 = R N (3)

其中,N是试验次数截尾值,RN为进行到N次试验时拒绝H0所需要的最小累计发生次数, ( A 1 , , A N ; R 1 , , R N ) 为截尾序贯检验方案的下上边界点,记 T ( N , R N ) 为截尾序贯检验方案,简记为T。

当采用序贯方法对统计假设(1)进行检验时,则停止法则和判断法则为:

当试验次数 n = 1 , 2 , , N 1 时,如果Sn ≤ An,停止实验,接受原假设H0,拒绝备择假设H1;如果An < Sn < Rn,尚不能做出判断,继续实验;如果Sn ≥ Rn,停止实验,拒绝原假设H0,接受备择假设H1

当试验次数n = N时,如果SN ≤ AN,停止实验,接受原假设H0,拒绝备择假设H1;如果SN ≥ RN,停止实验,拒绝原假设H0,接受备择假设H1

对截尾序贯检验方案T而言,其犯两类错误的实际概率及平均试验次数为判断检验方案优劣的基本统计特征量。给定检验水平 ( α 0 , β 0 ) ,其中,α0为H0成立时被拒收的概率上限;β0为H1成立时却被接收的概率上限。则在假设检验(1)下,截尾序贯检验方案T实际犯两类错误的真实概率表示如下:

α ( T ) = n = 1 n = N P { r e j e c t | λ = λ 0 , T } β ( T ) = n = 1 n = N P { a c c e p t | λ = λ 1 , T } (4)

其中,犯两类错误的真实概率满足以下条件:

α ( T ) α 0 , β ( T ) β 0 (5)

截尾序贯检验方案T在参数λ下的平均试验次数 E λ ( M | T ) 的计算表达式如下:

E λ ( M | T ) = E λ 0 ( M | T ) + E λ 1 ( M | T ) 2 (6)

其中

E λ 0 ( M | T ) = n = 1 n = N n ( P { r e j e c t | λ = λ 0 , T } + P { r e j e c t | λ = λ 0 , T } ) E λ 1 ( M | T ) = n = 1 n = N n ( P { a c c e p t | λ = λ 1 , T } + P { a c c e p t | λ = λ 1 , T } ) (7)

其中M表示试验结束时的累计试验次数。

在假设检验中,我们总是希望检验方案犯错误的概率小于给定水平 ( α 0 , β 0 ) 时,在 θ = θ 0 , θ = θ 1 处具有最少的平均试验次数。对此给出截尾序贯最优检验方案的定义如下:

定义2设 T O ( N , R N ) 为检验水平为 ( α 0 , β 0 ) 的截尾序贯检验,若对任意检验水平为 ( α 0 , β 0 ) 的截尾序贯检验 T ( N , R N ) 均有

E λ ( M | T O ) E λ ( M | T ) (8)

则称 T O ( N , R N ) 为统计假设(1)的截尾值为N,拒绝H0所需要最小累计计数数目为RN,检验水平为 ( α 0 , β 0 ) 时的平均试验次数最优的截尾序贯检验。

3. 样本空间排序法求解Poisson分布截尾序贯近似最优检验方案

上一节中,已经给出截尾序贯检验方案实际犯两类错误的概率、平均试验次数的计算表达式以及截尾序贯最优检验的相关定义。接下来将介绍采样本空间排序法求解Poisson分布的截尾序贯检验近似最优方案TS的步骤。

第1步:确定初始解 T c ( N , R N )

试验次数截尾值N以及拒绝H0所需要最小累计计数数目RN是事先需要确定的量。对于统计假设(1),给定检验水平 ( α 0 , β 0 ) ,采用传统假设检验进行抽样检验,检验统计量为Sm。此时当检验犯两类错误的概率均小于检验水平 ( α 0 , β 0 ) 时,可得试验次数N和初始样本量判别值RN,记为 [ N , R N ] ,对应求解公式如下所示:

α ( λ 0 ) = x = R N λ 0 x x ! e λ 0 α 0 β ( λ 1 ) = x = 0 R N λ 1 x x ! e λ 1 β 0 (9)

在此基础上,构造满足 α ( T c ) α 0 , β ( T c ) β 0 的初始方案Tc,将方案Tc记为如下形式。

T c ( N , R N ) = ( R 1 , R 2 , , R N 1 , 1 , , A N ) (10)

第2步:构造边界点的权重函数

在对边界点进行优化之前,需要对边界点的优化先后进行排序,即通过构造权重函数确定“最先需要”优化的边界点。权重函数可表示如下:

Q( R u )= [ E( M| T c ) ][ E( M| T c1, R u ) ]×[ α 0 α ( T c ) ] [ α ( T c1, R u ) α ( T c ) ][ β ( T c ) β ( T c1, R u ) ] Q( A d )= [ E( M| T c ) ][ E( M| T c1, A d ) ]×[ β 0 β ( T c ) ] [ β ( T c1, A d ) β ( T c ) ][ α ( T c ) α ( T c1, A d ) ] (11)

根据Tc的检验边界可分为对上边界点与下边界点的优化两种情形,表示如下:

T R u = ( R 1 R 2 R u 1 R u 1 R u + 1 R N A 1 A 2 A u 1 A u A u + 1 A N ) T A d = ( R 1 R 2 R d 1 R d R d + 1 R N A 1 A 2 A d 1 A d + 1 A d + 1 A N ) (12)

其中, u , d = 1 , 2 , , N 1 。当优化上边界点会增加犯第一类错误的概率,当优化下边界点会增加犯第二类错误的概率,但无论优化上边界点还是下边界点,都将会减少截尾序贯检验方案的平均试验次数。故当检验犯两类错误的真实概率小于并接近检验水平时,其平均试验次数会尽可能的达到最小。

第3步:迭代求解TS方案

截尾序贯检验方案的检验边界点 ( A 1 , , A N ; R 1 , , R N ) 与试验设计所要达到的期望风险 α ( T ) , β ( T ) 相关。在将对点Ui或Lj改进后的方案记为Tc1,重复步骤2直到检验方案犯第一类错误的概率大于α0,或检验方案犯第二类错误的概率大于β0为止。当满足犯两类错误的概率均小于或等于检验水平 ( α 0 , β 0 ) 的最后一个检验方案即为所求的截尾序贯最优检验方案TS

4. 算例分析以及模拟仿真

算例1给定检验水平 ( α 0 , β 0 ) = ( 0.1 , 0.1 ) 时,考虑如下统计假设的截尾序贯检验问题:

H 0 : λ = 3 V S H 1 : λ = 5 (13)

当试验次数截尾值N = 10,试验进行到N阶段,拒绝H0所需要的最小累计计数数目RN = 40时,若此时采用经典的固定试验样本量的抽样检验法,实际犯两类错误的概率 α = 0.046253 , β = 0.064570 ,显然此时的平均试验次数为10。若采用样本空间排序法设计的截尾序贯检验方案TS表示如下:

T S = ( 8 12 15 19 23 27 31 34 37 40 0 4 7 11 15 20 24 28 32 39 ) (14)

方案TS实际犯两类错误的概率分别为: α ( T S ) = 0.097761 β ( T S ) = 0.096473 ,方案TS在原假设H0以及备择假设H1下的平均试验次数分别为

E λ 0 = 3 ( M | T S ) = 4.199713 E λ 1 = 5 ( M | T S ) = 3.677888 (15)

对应的方案TS在参数λ下的平均试验次数为 E λ ( M | T S ) = 3.938800 。可以看出,检验方案TS所需要的平均试验次数相较与经典的规定试验样本量的假设检验减少明显,减少61%左右。此外,我们针对在不同检验水平 ( α 0 , β 0 ) 下, λ 0 , λ 1 不同取值组合时的多组试验方案进行计算。此外,为了验证TS方案基本统计指标的准确性和可靠性,采用蒙特卡洛方法模拟计算TS方案统计指标值,并计算TS方案统计指标值与真实值之间的均方误差(Mean Square Error, MSE),计算结果见表1

Table 1. TS statistical indexes of the truncated sequential approximate optimal test scheme under different test levels and its simulation

表1. 不同检验水平下的截尾序贯近似最优检验方案TS统计指标及其模拟仿真

表1中可以看到,不同检验水平 ( α 0 , β 0 ) 下, λ 0 , λ 1 不同取值组合时的多组试验方案所犯两类错误的概率均能小于给定的检验水平 ( α 0 , β 0 ) ,此外相较于固定试验样本量的抽样检验,其平均试验次数减少明显。如NO.21的截尾序贯检验方案平均试验次数减少75%,一半以上的截尾序贯检验方案平均试验次数减少50%以上,从而很大程度上减少抽样检验的试验成本。

当MSE越小,误差越小,越接近于0,即统计指标值与真实值之间越是吻合,表示方案的可靠性越高。从表1中我们可以看出,MSE[α'(TO)]、MSE[β'(TO)]、 M S E [ E λ ( M | T O ) ] 的最大值也就在0.0000左右波动,可见本文提出的TO方案具有可靠性和优良性。

5. 总结

本文对测量指标服从Poisson分布的电子商务产品截尾序贯近似最优检验进行了研究。在给定Poisson分布截尾序贯检验的相关定义、评价指标等基础上,采用样本空间排序法对Poisson分布的截尾序贯检验进行求解,所得截尾序贯检验近似最优方案TS具有以下性质:

1) 截尾序贯检验方案TS,实际犯两类错误的概率与设定的检验水平之间差异较小,即对检验水平能充分的利用。因此,其设计的Poisson分布截尾序贯检验方案TS的平均试验次数能尽可能达到最少。

2) 截尾序贯检验方案TS严格控制了实际犯两类错误的概率小于给定的检验水平 ( α 0 , β 0 ) 。当截尾序贯检验方案中实际犯两类错误的真实概率超过序贯检验水平 ( α 0 , β 0 ) 的情形,已不是对应检验水平 ( α 0 , β 0 ) 的检验了。可见,此时所设计的截尾序贯检验方案保证了检验方以及被检验方的利益。

3) 截尾序贯检验方案TS可设置检验水平不相等的情形,实用性更强,为检验者停供一种行之有效的检验方案。

文章引用

叶茂越,胡思贵,龙荣进. Poisson分布截尾序贯近似最优检验的研究——以电子商务产品的抽样检验为例
Study on Truncated Sequential Approximate Optimal Test of Poisson Distribution—Taking the Sampling Inspection of E-Commerce Products as an Example[J]. 电子商务评论, 2024, 13(01): 422-428. https://doi.org/10.12677/ECL.2024.131051

参考文献

  1. 1. 唐欣, 屈星斗. 质量监督抽查中网络抽样方式的研究和探讨[J]. 中国石油和化工标准与质量, 2022, 42(2): 95-97.

  2. 2. 宋明顺, 王慧琳, 顾龙芳, 等. 电子商务产品质量监督抽样方案特点分析[J]. 标准科学, 2015(5): 79-81+88.

  3. 3. 丁宏兴. 序贯截尾检验方案的设计研究[D]: [硕士学位论文]. 上海: 华东师范大学, 2013.

  4. 4. Lorden, G. (1976) 2-SPRT’S and the Modified Kiefer-Weiss Problem of Minimizing an Expected Sample Size. The Annals of Statistics, 4, 281-291. https://doi.org/10.1214/aos/1176343407

  5. 5. Huffman, M.D. (1983) An Efficient Approximate Solution to the Kiefer-Weiss Problem. The Annals of Statistics, 11, 306-316. https://doi.org/10.1214/aos/1176346081

  6. 6. 陈家鼎. 序贯分析[M]. 北京: 北京大学出版社, 1995: 88-89.

  7. 7. Lai, T.L. (2001) Sequential Analysis: Some Classical Problems and New Challenges. Statistica Sinica, 11, 303-408.

  8. 8. 濮晓龙, 闫章更, 茆诗松, 等. 计数型序贯网图检验[J]. 华东师范大学学报(自然科学版), 2006(1): 63-71.

  9. 9. Donnelly, T.G. (1957) A Family of Truncated Sequential Tests. Ph.D. Thesis, University of North Carolina, Durham.

  10. 10. 张可数, 朱允民, 李晓榕. 有限停时Neyman-Pearson型序贯概率比检验新方法(英文) [J]. 四川大学学报(自然科学版), 2002(3): 413-418.

  11. 11. 马海南, 李玮, 潘长缘. 截尾序贯设计的若干改进方案[J]. 江西师范大学学报(自然科学版), 2010, 34(3): 287-290.

  12. 12. Chang, M.N., Therneau, T.M., Wieand, H.S. and Cha, S.S. (1987) Designs for Group Sequential Phase II Clinical Trials. Biometrics, 43, 865-874. https://doi.org/10.2307/2531540

  13. 13. 胡思贵. 计数型截尾序贯检验的样本空间排序法[J]. 应用概率统计, 2013, 29(2): 201-212.

  14. 14. 胡思贵. 截尾序贯最优方法研究及其在机器电子商务产品质量检验中的应用[D]: [博士学位论文]. 贵阳: 贵州大学, 2019.

期刊菜单