经验分布函数

经验分布函数(英语:empirical distribution function)是统计学中一个与样本经验测度有关的分布函数。该累积分布函数是在所有n个数据点上都跳跃1/n阶跃函数。对被测变量的某个值而言,该值的分布函数值表示所有观测样本中小于或等于该值的样本所占的比例。

蓝线为经验分布函数,黑色长条表示相应的样本,绿线则是用于生成样本的累积分布函数。

经验分布函数是对用于生成样本的累积分布函数的估计。根据Glivenko–Cantelli定理英语Glivenko–Cantelli_theorem可以证明,经验分布函数以概率1收敛至这一累积分布函数。

定义

(x1, …, xn)为独立同分布的的实随机变量,它们共同的累积分布函数为F(t)。于是,经验分布函数可定义为 [1][2]

 

其中 为事件A指示函数。对给定的t p = F(t)时的伯努利随机变量。因而 则是期望为nF(t)、方差为nF(t)(1 − F(t))二项随机变量。这意味着 F(t)无偏估计

不过,有些文献中亦会将经验分布函数定义为[3][4]

 

参考文献

  1. ^ van der Vaart, A.W. Asymptotic statistics. Cambridge University Press. 1998: 265. ISBN 0-521-78450-6. 
  2. ^ PlanetMath 互联网档案馆存档,存档日期May 9, 2013,.
  3. ^ Coles, S. (2001) An Introduction to Statistical Modeling of Extreme Values. Springer, p. 36, Definition 2.4. ISBN 978-1-4471-3675-0.
  4. ^ Madsen, H.O., Krenk, S., Lind, S.C. (2006) Methods of Structural Safety. Dover Publications. p. 148-149. ISBN 0486445976