本條目存在以下問題,請協助 改善本條目或在 討論頁針對議題發表看法。
此條目需要 精通或熟悉相关主题的编者参与及协助编辑。 (2016年8月27日) 請邀請適合的人士改善本条目。更多的細節與詳情請參见討論頁。 |
|
在統計學中,混合模型(Mixture model)是用於表示母體中子母體的存在的機率模型,換句話說,混合模型表示了測量結果在母體中的機率分布,它是一個由數個子母體之機率分布組成的混合分布。混合模型不要求測量結果供關於各個子母體之機率分布的資訊即可計算測量結果在母體分布中的機率。
高斯混合模型(Gaussian Mixture Model)
對一維的隨機變數 的高斯分佈存在以下機率密度函數:
其中的 為 的標準差, 為 的期望值。
而當將高斯分佈推廣到 維時,根據定義,若 維的隨機向量 服從多變數的常態分佈,則存在一個對稱半正定的共變異數矩陣 以及期望值向量 滿足 的特徵函數。若 為非奇異的,則此分佈可以由以下的機率密度函數描述:
為共變異數矩陣的行列式。
而高斯混合模型为单一高斯概率密度函数的延伸,用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计子模型,每個子模型可視為此混合模型的隱變量。
舉一個不是那麼嚴謹的例子,若是我們手上有一個班級中所有學生某一次考試的各項科目分數分佈,並且每一科的分數都大致依照高斯分佈。則當我們要描述每個學生的總分分佈時,單高斯模型及多維的高斯模型不一定能很好的描述這個分佈,因為每一科的分布的情形都不盡相同,此時我們可以用高斯混合分佈更好的來描述這個問題。