Pure Mathematics
Vol. 13  No. 03 ( 2023 ), Article ID: 62467 , 8 pages
10.12677/PM.2023.133048

指数族分布的高阶矩

蔡正浩

东北大学秦皇岛分校数学与统计学院,河北 秦皇岛

收稿日期:2023年2月7日;录用日期:2023年3月7日;发布日期:2023年3月14日

摘要

本文中,我们介绍指数族分布并给出相关定义。利用微分运算和积分运算互逆推导几何分布高阶矩的递归公式,并运用特征函数与高阶矩的关系推导伽马分布高阶矩的一般公式。

关键词

指数族分布,几何分布,高阶矩,微积分,特征函数

Higher Order Moments of Exponential Family Distribution

Zhenghao Cai

School of Mathematics and Statistics, Northeastern University at Qinhuangdao, Qinhuangdao Hebei

Received: Feb. 7th, 2023; accepted: Mar. 7th, 2023; published: Mar. 14th, 2023

ABSTRACT

In this paper, we introduce the exponential family distribution and give the relevant definition. The recursive formula of higher order moments of geometric distribution is derived by the reciprocal differential operation and integral operation, and the general formula of higher order moments of gamma distribution is derived by the relation between characteristic function and higher order moments.

Keywords:Exponential Family Distribution, Geometric Distribution, Higher Order Moments, Calculus, Eigenfunction

Copyright © 2023 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

指数族分布亦称指数型分布族,是统计中最重要的参数分布族,包含了几何分布、正态分布等。高阶矩是变量在不同的阶数距离零点和中心的距离,在风险估计、颜色传输等领域有着广泛的应用。

高阶矩的研究是概率论领域问题的重要组成。1785年,俄国数学家李雅普诺夫创造性地提出特征函数,为后世研究高阶矩打开了思路。在数学成果不断完善的过程中,高阶矩的研究从理论逐渐被运用到不同模型的优化中,如颜色传输中,高阶矩的引入优化了图像细节,增加了颜色变换效果的真实性;在金融投资中,高阶矩波动性建模不断发展,高阶矩风险的考量为投资决策提供可靠的理论依据;同时,在研究未知概率密度函数时,高阶矩可以获得较好逼近效果的级数展开式……目前以高阶矩为基础建立的部分具有可行性的模型尚未在国内得到重视,亟需厚实的理论基础佐证 [1] [2] [3] [4] 。

本文主要通过对几何分布和伽马分布高阶矩的求解加深读者对指数族分布的认识,并且为重要分布高阶矩在不同领域中的应用提供理论分析。本文的结构安排如下:

2节中将介绍指数族分布并给出相关实例。

3节中将研究几何分布期望和方差,并将微分和积分的方法运用到高阶零点矩递归公式的推导中。

4节将推导伽马分布的特征函数并证明其高阶零点矩的存在性,通过特征函数和高阶零点矩之间的关系推导其高阶零点矩的一般形式。

2. 指数族分布

指数族分布的统一表示形式

定义1

如果一个概率密度函数族或概率质量函数族能够表示成如下的形式:

f ( x | θ ) = h ( x ) c ( θ ) exp [ i = 1 k ω i ( θ ) t i ( x ) ]

其中 h ( x ) 0 t 1 ( x ) , , t i ( x ) 是观测值x的(不依赖 θ 的)实值函数, c ( θ ) 0 ω 1 ( θ ) , , ω i ( θ ) 是向量值参数 θ 的(不依赖x的)实值函数。那么就称它是指数族的 [5] 。

例1考察参数为 λ 的泊松分布

参数为 λ 的泊松分布的概率密度函数为:

f ( n | λ ) = λ n n ! exp ( − λ )

其中 λ > 0 n = 0 , 1 , 2 ,

h ( n ) = 1 c ( λ ) = λ n n ! , λ > 0

ω 1 ( λ ) = λ , λ > 0 t 1 ( n ) = 1

于是

f ( n | λ ) = h ( n ) c ( λ ) exp [ ω 1 ( λ ) t 1 ( n ) ]

即泊松分布属于指数族分布。

3. 几何分布及其高阶零点矩

下面将介绍几何分布并利用微积分求其高阶零点矩的递归公式。

3.1. 几何分布

定义2

文字叙述:在伯努利试验中,试验n次才得到第一次成功的机率。即前n − 1次皆失败,第n次成功的概率。

数学语言描述:在伯努利试验中,记每次试验中事件A发生的概率为p,试验进行到事件A出现时停止,此时所进行的试验次数记为X,其分布列满足:

P ( X = n ) = ( 1 p ) n 1 p , n = 1 , 2 ,

此分布列是几何数列的一般项,因此称X服从几何分布,记为 X ~ G e ( p )

推论1

几何分布的期望和方差分别为

E ( X ) = 1 p

D ( X ) = 1 p p 2

证根据期望的定义知

E ( X ) = n = 1 n ( 1 p ) n 1 p = p n = 1 n ( 1 p ) n 1

f ( x ) = n = 1 n x n 1 ,当 0 < x < 1 时,可逐项积分得

0 x f ( t ) d t = n = 1 0 x n t n 1 d t = n = 1 x n (1)

因为 n = 1 x n = 1 1 x 1 ,所以(1)式就可以化成

0 x f ( t ) d t = 1 1 x 1

两边求导得

f ( x ) = 1 ( 1 x ) 2 (2)

x = 1 p 代入(2)式得

f ( 1 p ) = 1 p 2

进而得出

E ( X ) = 1 p 2

随机变量的方差为

D ( X ) = E ( X 2 ) [ E ( X ) ] 2 = p n = 1 n 2 ( 1 p ) n 1 1 p 2

g ( x ) = n = 1 n 2 x n 1 ,当 0 < x < 1 时,可逐项积分得

0 x g ( t ) d t = n = 1 0 x n 2 t n 1 d t = n = 1 n x n = x n = 1 n x n 1 (3)

将(2)式代入(3)式得

0 x g ( t ) d t = x ( 1 x ) 2

两边求导得

g ( x ) = 1 + x ( 1 x ) 3 (4)

x = 1 p 代入(4)式得

g ( 1 p ) = 2 p p 3

进而得出

D ( X ) = p 2 p p 3 1 p 2 = 1 p p 2

综上,证毕 [6] 。

注:这里微积分的使用运用了幂级数的知识。

1) 幂级数 n = 0 a n x n 的收敛半径为 r ( > 0 ) ,其 S ( x ) 对应的和函数为,则幂级数在收敛区间 r < x < r

部可以逐项微商与逐项积分。

2) 在1)的条件下, S ( x ) 和函数在 ( r , r ) 内任意次可微,且 S ( k ) ( x ) 等于 n = 0 a n x n 逐项微商k次所得的

幂级数。

以上性质就是微积分在求几何分布时具有运用合理性的理论基础 [7] 。

3.2. 几何分布的高阶零点矩

结论1

几何分布的k阶零点矩满足以下的递归公式:

f k ( x ) = n = 1 n k x n 1 , k = 1 , 2 , (5)

f k + 1 ( x ) = d [ x f k ( x ) ] d x , k = 1 , 2 , (6)

其中

f 1 ( x ) = 1 ( 1 x ) 2

E ( X k ) = p f k ( 1 p ) , k = 1 , 2 ,

证 根据高阶零点矩的定义知

E ( X k ) = p n = 1 n k ( 1 p ) n 1 , k = 1 , 2 ,

f k ( x ) = n = 1 n k x n 1 , k = 1 , 2 ,

显然

E ( X k ) = p f k ( 1 p ) , k = 1 , 2 ,

下证(6)式成立

将(5)式代入(6)式得

对于(5)式左边: f k + 1 ( x ) = n = 1 n k + 1 x n 1

对于(6)式右边: d [ x f k ( x ) ] d x = n = 1 n k + 1 x n 1

左边等于右边

综上,证毕。

注:

1) 对于结论的验证运用了推论1中注的知识。

2) 这里的结论的给出同样采用了微积分的方法,而上述证明是从结论出发的,并不涉及结论如何产生。结论的产生是采用了推论1的证明方法,是这种微积分方法低阶到高阶的延申,下面将简述结论的产生思路:

由推论1中的(2)式到(4)式的推导过程得

g ( x ) = d [ x f ( x ) ] d x

这里已经检验了k = 1的时候结论成立。

同样的方法可以证明k = 2成立,即结论对于低阶成立。那么同样的思想考虑高阶的推广形式,进而得出结论,最后采用证1的方法进行验证。

4. Gamma分布及其高阶零点矩

下面将介绍Gamma分布并求其特征函数,利用特征函数求解Gamma分布。

4.1. Gamma分布

定义2

Gamma分布用来描述直到第 α 件事发生所需的等候时间。

其概率密度函数满足

f ( x ) = { λ α Γ ( α ) x α 1 e λ x , x 0 0 , x < 0

其中 α > 0 , λ > 0 。Gamma分布中的参数 α 称为形状参数, λ 称为逆尺度参数。

注:

τ ( α ) = 0 + t α 1 e t d t , α > 0

Γ 函数。

4.2. Gamma分布的特征函数

结论2

Gamma分布的特征函数表示形式如下:

φ ( t ) = ( 1 i t λ ) α

根据特征函数的定义,Gamma分布的特征函数表示形式为

φ ( t ) = E ( e i t x ) = 0 + e i t x λ α Γ ( α ) x α 1 e λ x d x

将式子进一步处理得到

0 + e i t x λ α Γ ( α ) x α 1 e λ x d x = λ α Γ ( α ) 0 + x α 1 e ( λ i t ) x d x

y = ( λ i t ) x ,则 d y = ( λ i t ) d x

φ ( t ) = E ( e i t x ) = λ α Γ ( α ) 0 + x α 1 e ( λ i t ) x d x = λ α Γ ( α ) 1 ( λ i t ) α 0 + y α 1 e y d y = λ α Γ ( α ) 1 ( λ i t ) α Γ ( α ) = ( 1 i t λ ) α

证毕。

4.3. Gamma分布的高阶零点矩

4.3.1. 高阶零点矩的存在性

要利用Gamma分布的特征函数求解,首先必须保证Gamma分布k阶矩存在,这样对应的特征函数就可以k阶微分,从而求出Gamma分布k阶矩。下面证明Gamma分布的k阶零点矩存在。

k阶零点矩表达式为

E ( x k ) = 0 + x k λ α Γ ( α ) x α 1 e λ x d x = λ α Γ ( α ) 0 + x α + k 1 e λ x d x

这里因为 λ α Γ ( α ) 为常数, E ( x k ) 对的收敛性没有影响,因此只考虑 0 + x α + k 1 e λ x d x 这一部分,即考虑 0 + x α + k 1 e λ x d x 的收敛性。

根据无穷限积分收敛性的p判别法和洛必达法则可以证明

lim x + x α + k 1 e λ x 1 x 2 = lim x + x α + k + 1 e λ x = 0

其中 α + k + 1 0 λ > 0 。这里根据 l = 0 , p = 2 知,积分收敛。

继而得出

E ( x k ) = λ α Γ ( α ) 0 + x α + k 1 e λ x d x

存在,即Gamma分布k阶矩存在。

4.3.2. 高阶零点矩公式

结论3

Gamma分布的高阶零点矩的表示形式如下:

m k = ( 1 β ) k ( α ) ( α 1 ) ( α k + 1 ) , k = 1 , 2 ,

由4.3.1知Gamma分布k阶矩存在,且特征函数k阶可微,即

m k = E ( x k ) = i k φ ( k ) ( 0 ) = i k [ d k d t k φ ( t ) ] t = 0

由4.1知Gamma分布的特征函数为

φ ( t ) = ( 1 i t λ ) α

代入上式得

m k = ( 1 β ) k ( α ) ( α 1 ) ( α k + 1 ) , k = 1 , 2 ,

证毕。

注:

1) 特征函数法不仅适用于连续型随机变量,也同样适用于离散型。

2) 离散型随机变量的高阶零点矩一般使用递推公式表示,而连续型随机变量一般可以直接表示出结果。

文章引用

蔡正浩. 指数族分布的高阶矩
Higher Order Moments of Exponential Family Distribution[J]. 理论数学, 2023, 13(03): 437-444. https://doi.org/10.12677/PM.2023.133048

参考文献

  1. 1. 王春荣. 关于伽马分布变异系数比的统计推断问题[D]: [硕士学位论文]. 青岛: 青岛大学, 2021.

  2. 2. 赵国英, 向世明, 李华. 高阶矩在颜色传输中的应用[J]. 计算机辅助设计与图形学学报, 2004(1): 62-66+151-152.

  3. 3. 许启发. 高阶矩波动性建模及应用[J]. 数量经济技术经济研究, 2006(12): 135-145.

  4. 4. 凌迎春, 胡秉民. 高阶矩在概率密度逼近中的应用[J]. 工科数学, 1996, 12(3): 111-116.

  5. 5. George Casella, Roger L. Berger. 统计推断[M]. 张忠占, 傅莺莺, 译. 北京: 机器工业出版社, 2009: 102.

  6. 6. 许在库. 用积分一求导法求几何分布的期望与方差[J]. 中山大学学报论丛, 2002, 22(5): 13-14.

  7. 7. 邓东皋, 尹小玲. 数学分析简明教程(下册) [M]. 第二版. 北京: 高等教育出版社, 2005: 102-104.

期刊菜单