累积量生成函数

随机变数的累积量生成函数κ_nX是定义为：对动差生成函数取自然对数的函数，如果符合定义，将如下所示：

g(t)=\log(E(e^{tX}))=\sum _{n=1}^{\infty }\kappa _{n}{\frac {t^{n}}{n!}}=\mu t+\sigma ^{2}{\frac {t^{2}}{2}}+\cdots

。

将累积量生成函数g(t)对t等于零之处求导

{\begin{aligned}\kappa _{1}&=\mu =g'(0),\\\kappa _{2}&=\sigma ^{2}=g''(0),\\&{}\ \ \vdots \\\kappa _{n}&=g^{(n)}(0).\end{aligned}}

累积量生成函数与几率分布的动差值有很强的关联性。假如随机变数X存在期望值μ = E(X)及变异数σ² = E((X − μ)²)，则累积量生成函数g(t)的一阶与二阶微分刚好是上述数值：μ = κ₁及σ² = κ₂。第c阶累积量表达的方式为

\kappa _{n}=\langle X^{n}\rangle _{c}.\,

使用累积量生成函数优于动差值的情况在于独立变数X和Y，

{\begin{aligned}g_{X+Y}(t)&=\log(E(e^{t\cdot (X+Y)}))=\log(E(e^{tX})\cdot E(e^{tY}))\\&=\log(E(e^{tX}))+\log(E(e^{tY}))=g_{X}(t)+g_{Y}(t).\end{aligned}}

如此一来随机变量之和的累积量可表达成各自累积量的之和，也就是具有可加性。

一个具有各阶累积量的分布可以使用埃奇沃斯级数来近似。

有些作者^[1]^[2]偏好定义累积量生成函数为对特征函数取自然对数，或者有人称为第二特征函数，^[3]^[4]

h(t)=\log(E(e^{itX}))=\sum _{n=1}^{\infty }\kappa _{n}{\frac {(it)^{n}}{n!}}=\mu it-\sigma ^{2}{\frac {t^{2}}{2}}+\cdots .\,

使用此函数的好处在于，即便可能随机变数X是一大变量仍被完整定义。尽管他的累积量生成函数或者是动差生成函数是存在的，但在这种情况下，通常不允许被展开成累积量生成函数或者是动差生成函数而表达成线性级数数列的模式。生成函数无法被展开的两个例子是柯西分布和莱维分布（英语：Lévy distribution）（它们是稳定分布）。

一些离散随机变数的累积量

退化的随机变数X = 1的累积量生成函数为g (t) = 1.第一累积量为κ₁ = g '(0) = 1，其他的累积量为零，κ₂ = κ₃ = κ₄ = ... = 0.

退化的随机变数X = μ.每一个累积量是退化的随机变数X = 1的μ倍。其积量生成函数为g '(t) = μ. 第一累积量为κ₁ = g '(0) = μ，其他的累积量为零，κ₂ = κ₃ = κ₄ = ... = 0.

伯努利分布，特殊情形为p = 1时是退化的随机变数X = 1.累积量生成函数为g '(t) = ((p⁻¹−1)·e^−t + 1)⁻¹。第一累积量为κ₁ = g '(0) = p，κ₂ = g ' '(0) = p·(1 − p) .其累积量可以整理成下面形式

\kappa _{n+1}=p(1-p){\frac {d\kappa _{n}}{dp}}.\,

几何分布，累积量生成函数为g '(t) = ((1 − p)⁻¹·e^−t − 1)⁻¹。第一累积量为κ₁ = g '(0) = p⁻¹ − 1，κ₂ = g ' '(0) = κ₁·p^− 1.代换p = (μ+1)⁻¹可得g '(t) = ((μ⁻¹ + 1)·e^−t − 1)⁻¹及κ₁ = μ.

泊松分布，累积量生成函数为g '(t) = μ·e^t.所有的累积量均为：κ₁ = κ₂ = κ₃ = ...=μ.

二项分布，其特殊情形是n = 1时为伯努利分布。每一累积量是n倍相对应的伯努利分布。累积量生成函数为g '(t) = n·((p⁻¹−1)·e^−t + 1)⁻¹。第一累积量为κ₁ = g '(0) = n·p及κ₂ = g ' '(0) = κ₁·(1−p)。代换p = μ·n⁻¹可得g '(t) = ((μ⁻¹ − n⁻¹)·e^−t + n⁻¹)⁻¹及κ₁ = μ。极限值逼近情形则为n⁻¹ = 0之卜瓦松分布。

负二项分布，其特殊情形为n = 1时是为几何分布。每一累积量是n倍相对应的几何分布。累积量生成函数为g '(t) = n·((1−p)⁻¹·e^−t−1)⁻¹。第一累积量为κ₁ = g '(0) = n·(p⁻¹−1)，及κ₂ = g ' '(0) = κ₁·p⁻¹.代换p = (μ·n⁻¹+1)⁻¹可得g '(t) = ((μ⁻¹+n⁻¹)·e^−t−n⁻¹)⁻¹及κ₁ = μ.比较二项分布与本公式可以知悉负二项分布名字的由来。极限值逼近情形则为n⁻¹ = 0之卜瓦松分布。

参考资料

^ Kendall, M.G., Stuart, A.（1969）The Advanced Theory of Statistics, Volume 1 (3rd Edition). Griffin, London.（Section 3.12）
^ Lukacs, E.（1970）Characteristic Functions（2nd Edition）. Griffin, London.（Page 27）
^ Lukacs, E.（1970）Characteristic Functions（2nd Edition）. Griffin, London.（Section 2.4）
^ Aapo Hyvarinen, Juha Karhunen, and Erkki Oja (2001) Independent Component Analysis, John Wiley & Sons.（Section 2.7.2）

[1] Kendall, M.G., Stuart, A.（1969）The Advanced Theory of Statistics, Volume 1 (3rd Edition). Griffin, London.（Section 3.12）

[2] Lukacs, E.（1970）Characteristic Functions（2nd Edition）. Griffin, London.（Page 27）

[3] Lukacs, E.（1970）Characteristic Functions（2nd Edition）. Griffin, London.（Section 2.4）

[4] Aapo Hyvarinen, Juha Karhunen, and Erkki Oja (2001) Independent Component Analysis, John Wiley & Sons.（Section 2.7.2）

[1]

[2]

[3]

[4]