网络设计的经验借鉴

CNN

激活函数

目的：将卷积后的结果压缩到某一个固定的范围,保证数值范围可。控

缺点

训练的时候很容易就die了，即出现non；

技巧：设置learning rate，不要让网络训练过程中出现很多dead神经元；

减少参数的目的其实就是正则化：训练参数减少了，网络就变得简单了，就不容易过拟合，就达到了类似于正则化的效果；

根据实际需求来，不然把样本搞太难，网络学起来不好学；

经验：softmax损失比sigmoid损失，更容易学，所以尽量用softmax损失；