首页 > 其他 > 详细

长尾数据

时间:2021-09-06 03:29:36      阅读:20      评论:0      收藏:0      [点我收藏+]

长尾数据分布问题即少数类占大部分数据,而大多数类的代表性不强、数据量不足。

针对该问题:

  1. 重采样 ? 过采样增加了来自小类别的重复样本,可能导致模型过拟合。为解决这个问题,可以从相邻的样本中插入新的样本,或者对辅类合成新的样本。然而,由于新样本中的噪声,模型仍然容易出错。(简单的数据扩增会引入噪声)
  2. 每个Batch对不同类样本设置选取比例,保证在一个Batch里数据相对均衡。
技术分享图片

长尾数据

原文:https://www.cnblogs.com/zzh66/p/15223867.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!