首页 > 其他 > 详细

交叉验证

时间:2020-03-06 10:19:17      阅读:54      评论:0      收藏:0      [点我收藏+]

交叉验证可分解为交叉和验证,两者都必不可少。

先讲讲较常见的cross-validation的例子

step 1: 将有标签的数据平均分为6份, D1, D2, D3, D4, D5, D6, 将D6设置成测试集,不参与任何的模型训练和参数选择,只用来评估最后模型的结果

step 2: 对所有想要测试数据预处理,模型和参数的组合列出来 (unigram 处理特征的 c=1 的 linear SVM, bigram 处理特征的 c=1 的 linear SVM)。

step 3: D1 到 D5轮流做validation set, 用剩余四个做模型训练集, 训练每一个step 2 得到的组合。并在validation set上计算度量指标(MSE, ACCURACY, F1等)。

step 4: 根据每个模型组合在五个validation set中的平均指标,选出最好的模型组合

step 5: 选择最好的模型参数组合, 使用D1,D2,D3,D4,D5来进行训练,并计算在D6上的指标,用此来估计模型的泛化误差

 



作者:大数据小学生
链接:https://www.zhihu.com/question/39259296/answer/623836397
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

交叉验证

原文:https://www.cnblogs.com/focusonoutput/p/12424325.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!