混合模型

在统计学中,混合模型(Mixture model)是用于表示母体中子母体的存在的几率模型,换句话说,混合模型表示了测量结果在母体中的几率分布,它是一个由数个子母体之几率分布组成的混合分布。混合模型不要求测量结果供关于各个子母体之几率分布的资讯即可计算测量结果在母体分布中的几率。

高斯混合模型(Gaussian Mixture Model)

对一维的随机变数 的高斯分布存在以下几率密度函数

 

其中的  标准差  期望值

而当将高斯分布推广到 维时,根据定义,若 维的随机向量 服从多变数的常态分布,则存在一个对称半正定共变异数矩阵 以及期望值向量 满足 的特征函数。若 非奇异的,则此分布可以由以下的几率密度函数描述:

  为共变异数矩阵的行列式。

而高斯混合模型为单一高斯概率密度函数的延伸,用多个高斯概率密度函数(常态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(常态分布曲线)分布的统计子模型,每个子模型可视为此混合模型的隐变量

举一个不是那么严谨的例子,若是我们手上有一个班级中所有学生某一次考试的各项科目分数分布,并且每一科的分数都大致依照高斯分布。则当我们要描述每个学生的总分分布时,单高斯模型及多维的高斯模型不一定能很好的描述这个分布,因为每一科的分布的情形都不尽相同,此时我们可以用高斯混合分布更好的来描述这个问题。