高斯混合模型 GMM

高斯混合模型 GMM 是一个无监督学习,假设数据是由多个高斯分布混合而成的。

我们假设将数据分成 个高斯分布,我们可以写作 ,其中 是均值, 是协方差矩阵,简记作

因此我们可以把数据 对于第 个高斯分布的概率写作:

如果我们用指示变量(indicator variable),表示某个数据点属于哪个高斯分量,则可以写作:

考虑 是 iid 的,因此其联合分布可以写作:

并非是观测出来的值,因此我们称其为隐变量(latent variable)。

考虑我们有 个高斯分布,我们需要知道我们怎么混合这个高斯分布。我们可以用 表示,即我们可以认为 为数据点属于第 个高斯分布权重,假设有 3 个高斯分布,且 ,则数据点属于第 1 个高斯分布的概率为 0.3,属于第 2 个高斯分布的概率为 0.5,属于第 3 个高斯分布的概率为 0.2。 控制着各个高斯分量在混合模型中的"比重",实际上定义了多项分布(Multinomial)的参数,这个分布用于随机选择使用哪个高斯分量。即: