首页 > 其他 > 详细

sklearn.svm 支持向量机

时间:2020-07-23 21:55:08      阅读:94      评论:0      收藏:0      [点我收藏+]

支持向量机(SVM)用于监督学习,可用于分类、回归、异常检测

SVM本来是一种线性分类和非线性分类都支持的二元分类算法,但经过演变,现在也支持多分类问题,也能应用到了回归问题

一、模型原理

在给定的训练样本,找到一个超平面将不同类别的样本分开

技术分享图片

 

1.超平面的公式如下:

技术分享图片

 

其中,ω= (ω1,ω2...ωn) 为法向量,决定了超平面的方向,b是位移向,决定了超平面和原点之间的距离

 

2.样本到超平面的距离,样本空间中任意点x到超平面(记为(ω,b))的距离:

技术分享图片

 

3.约束条件和支持向量机(support vector)

技术分享图片

式(6.3)即为超平面将训练样本正确分类的约束条件。如下图所示,距离超平面最近的三个训练样本使得式(6.3)的等号成立,它们就是支持向量

技术分享图片

 

4.间隔(margin):两个不同类别的支持向量分别到超平面的距离之和

技术分享图片

 最优的划分超平面需要使得间隔 r 最大化

 技术分享图片

 

 这就是支持向量机的基本型



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

支持向量机的优势:

(1)在高维空间非常高效

(2)即使在数据维度比样本数量大的情况下仍然有效

(3)在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的

(4)通用性: 不同的核函数 核函数 与特定的决策函数一一对应.常见的 kernel 已经提供,也可以指定定制的内核

支持向量机缺点:

(1)如果特征数量比样本数量大得多,在选择核函数 核函数 时要避免过拟合, 而且正则化项是非常重要的

(2)支持向量机不直接提供概率估计,这些都是使用昂贵的五次交叉验算计算的

 

sklearn.svm 支持向量机

原文:https://www.cnblogs.com/cgmcoding/p/13367216.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!