上图是 5 个不同的模型,从左往右依次分析:
原高斯分布模型和多元高斯分布模型的比较
原高斯分布模型 | 多元高斯分布模型 |
---|---|
不能捕捉特征之间的相关性但可以通过将特征进行组合的方法来解决(例如对特征进行加法或乘法) | 自动捕捉特征之间的相关性 |
计算代价低,能适应大规模的特征 | 计算代价较高 训练集较小时也同样适用(因为需要计算协方差矩阵的行列式和逆) |
1.必须要有 m>n,否则协方差矩阵不可逆,通常需要 m>10n;2. 特征冗余(比如两个向量间线性相关,有加法或乘法的关系)也会导致协方差矩阵不可逆 |
原高斯分布模型被广泛使用着,如果特征之间在某种程度上存在相互关联(线性相关)的情况,可以通过构造新特征的方法来捕捉这些相关性
如果训练集不是太大,并且没有太多的特征,可以使用多元高斯分布模型
[吴恩达机器学习笔记]15非监督学习异常检测7-8使用多元高斯分布进行异常检测
原文:https://www.cnblogs.com/cloud-ken/p/9629539.html