本条目存在以下问题,请协助 改善本条目或在 讨论页针对议题发表看法。
此条目需要 精通或熟悉相关主题的编者参与及协助编辑。 (2016年8月27日) 请邀请适合的人士改善本条目。更多的细节与详情请参见讨论页。 |
|
在统计学中,混合模型(Mixture model)是用于表示母体中子母体的存在的几率模型,换句话说,混合模型表示了测量结果在母体中的几率分布,它是一个由数个子母体之几率分布组成的混合分布。混合模型不要求测量结果供关于各个子母体之几率分布的资讯即可计算测量结果在母体分布中的几率。
高斯混合模型(Gaussian Mixture Model)
对一维的随机变数 的高斯分布存在以下几率密度函数:
其中的 为 的标准差, 为 的期望值。
而当将高斯分布推广到 维时,根据定义,若 维的随机向量 服从多变数的正态分布,则存在一个对称半正定的共变异数矩阵 以及期望值向量 满足 的特征函数。若 为非奇异的,则此分布可以由以下的几率密度函数描述:
为共变异数矩阵的行列式。
而高斯混合模型为单一高斯概率密度函数的延伸,用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计子模型,每个子模型可视为此混合模型的隐变量。
举一个不是那么严谨的例子,若是我们手上有一个班级中所有学生某一次考试的各项科目分数分布,并且每一科的分数都大致依照高斯分布。则当我们要描述每个学生的总分分布时,单高斯模型及多维的高斯模型不一定能很好的描述这个分布,因为每一科的分布的情形都不尽相同,此时我们可以用高斯混合分布更好的来描述这个问题。