监督学习是指我们给予算法一个数据集,这个数据集可以是以往相同类型问题的结果,或者绝对正确的经验答案的集合,也就是统计中常说的样本,并且这些数据都是有其固有的“正确答案”,然后算法根据这个集合做出对当前相同类型的问题的结果预测。绝大部分的情况我们给予算法的数据集都是离散的数据。所谓监督(supervised),就是利用已有的正确样本(“特征-结果”对)约束了算法的预测。
简单的说就是你看着这些练习册和参考答案给我学会了,然后给我根据关系类比出类似的问题答案。
针对于不同类型的问题,需要给出不同类型的结果,所以对于这些问题分为:
对于这两类问题,一般的判断方法,当你最后需要获得的预测结果的值域是连续的,可以认为是回归问题,最后需要获得的结果是离散的,例如0 or 1,或者有限个数类型的结果,则就属于分类问题。很多时候在自然语言中会更好理解。
对于无监督学习,我们依然给予算法一个数据集,但是这个数据集不具有明确的“特征-结果”对,或者说就是一堆较为单纯无标签的数据。这时候我们就需要算法对这堆数据进行自我分析,归类,整理。
原文:https://www.cnblogs.com/pullself/p/10339005.html