博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
深度学习的batch_size
阅读量:6203 次
发布时间:2019-06-21

本文共 342 字,大约阅读时间需要 1 分钟。

知乎讨论:

 

案例一

http://www.myzaker.com/article/5a68020fd1f1495d57000030/

Training Imagenet in one hour

本篇论文发现了 large batch 可以大大的提升分类网络的收敛速度,通过把 batch size 从 256 提升到 8192,将训练时间从几周降低到了 1 个小时,大大提升了神将网络的训练速度。

 

案例二

insightface 人脸识别讨论

batch size越大越好

 

实际中,受限于显卡内存的限制,batch_size不能无限增大,导致网络收敛速度慢。

从统计学的角度来看,batch_size越大意味着,参与计算各种mean计算的结果(BN, avg Grident)越准确.

 

转载地址:http://ldqca.baihongyu.com/

你可能感兴趣的文章
JList的基本操作
查看>>
【笔记】一些linux实用函数技巧【原创】
查看>>
创业-程序员独自5大思维障碍
查看>>
【转】Javascript Base64编码与解码
查看>>
merge into ORA-30926
查看>>
解决SublimeCodeIntel回车换行误打代码
查看>>
Javascript的setTimeOut()和setInterval()的定时器用法
查看>>
NotifyMyFrontEnd 函数背后的数据缓冲区(一)
查看>>
全球首发免费的MySql for Entity Framework Core
查看>>
iOS:多线程技术GCD的使用
查看>>
Google 最新的 Fuchsia OS【科技讯息摘要】
查看>>
javascript中对变量类型的推断
查看>>
在.NET中使用SMTP发送邮件
查看>>
ZJUT 地下迷宫 (高斯求期望)
查看>>
Lambda表达式的前世今生
查看>>
PHP绘制3D图形
查看>>
Unity Camera的两种模式
查看>>
在VirtualBox里复制VDI文件[转]
查看>>
在datatable中,在指定位置插入列
查看>>
linux下安装php的swoole扩展模块(安装后php加载不出来?)
查看>>