首页 > Web开发 > 详细

EfficientNet

时间:2020-02-02 15:01:40      阅读:77      评论:0      收藏:0      [点我收藏+]

https://arxiv.org/pdf/1905.11946.pdf

https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet

 

扩展网络有三个维度,包括width(channels数)、depth(网络深度)、resolution输入分辨率。

作者通过实验表明,只改变其中一个维度,acc的提升很容易就饱和了,如何同时改变三个维度,使得acc和flops达到一个trade-off,就是本文的内容。

技术分享图片

 

 

 作者提出的一种缩放方法。网络深度增加一倍,flops变为之前的两倍;width或者resolution增加一倍,flops变为之前的四倍。

统一起来,增加的计算量技术分享图片。论文里限制技术分享图片,所以增加的计算量大概为 技术分享图片

技术分享图片

 

 

 

下面是作者以MBConv+SE模块搜索出来的一个结构。首先固定技术分享图片,即搜索出来的flops是之前的2倍,

 

 

得到一组最优值技术分享图片

 

 

然后固定这三个参数,调整技术分享图片,得到B1至B7的一系列网络(具体实验结果可参考原文)。

 

 

技术分享图片

 

 

 值得注意的是,这个网络中,降采样用conv+str2代替conv+maxpool(相当于flops变为了1/4);用了5*5的卷积核,

减小了计算量,参考https://www.zhihu.com/question/326833457

技术分享图片

 

 

更多讨论参考https://www.zhihu.com/question/326833457 

EfficientNet

原文:https://www.cnblogs.com/573177885qq/p/12252099.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!