重尾分布

机率论中,重尾分布(英语:Heavy-tailed distribution)是一种机率分布的模型,它的尾部比指数分布还要厚。在许多状况中,通常右边尾部的分布会比较受到重视,但左边尾部比较厚,或是两边尾部都很厚的状况,也会被认为是一种重尾分布。

重尾分布之中,又有两个子类型,分别称为长尾分布(long-tailed distributions)以及次指数分布(subexponential distributions)。

定义

重尾分布

在一个累积分布函数中,一个随机变量 X 的分布状况,在以下状况时,被称为是一个重尾分布。假设:

 

如果以尾部分布函数的方式来呈现时,

 

最后可以被写成:

 

这相当于一个动差生成函数 F, MF(t) ,对所有的t > 0 来说,都是无限的[1]

重尾分布的左尾,与双尾分布,定义相同。

长尾分布

在一个累积分布函数中,一个随机变量 X 的分布,出现以下状况时,被称为是一个长尾分布。假设对所有t > 0 :

 

这相等于

 

对一个右尾部形成长尾分布的状况,我们可以做一个直观的解释:假如一个长尾分布的尾部数量超过某个很高的水准,它超过另一个更高水准的机率会接近于一。也就是说,如果你发现状况很糟,它可能会比你想像的还要糟。

长尾分布是重尾分布中的一个特例。所有的长尾分布都是重尾分布,但反之则不然,也就是说,我们可以找出某一个重尾分布,它不是长尾分布。

次指数分布

次指数分布是以机率分布折积定义出来的。两个独立、不同的随机变数  的共同分布函数  ,它自己的折积定义为  ,使用勒贝格-史台杰斯积分(Lebesgue–Stieltjes integration) 定义为:

 

n-fold折积的  也以同样方式定义。其尾端分布函数   定义为 

当以下式子成立,机率分布函数 在正的中线(positive half-line)上,被定义为次指数分布:

 

这也意味著,对所有  来说:

 

注释

  1. ^ Rolski, Schmidli, Scmidt, Teugels, Stochastic Processes for Insurance and Finance, 1999