概述
这是2017上学期计算机视觉课程的project,识别带有字符倾斜和噪点的4字符验证码,已有训练集为6字符的验证码图片。
最终成果
思路1:传统方法
可见,骨架细化后虽然速度差不多,但是精度下降很多。
传统方法结果分析与改进
思路2:CNN
CNN结果与传统方法结果对比如下:
总结
- 此处SVM泛化能力更好,单个字符识别率96.7%
- CNN模型复杂反而起反作用,尝试Conv层间添加1×1降维和shortcut没啥效果
- CNN中用几个小的3×3卷积核代替大的卷积核,收敛速度和泛化能力都有提升