个人展示
一、自己做的APP展示1、实时人像留色 融合时,将原图的灰度图设置为背景即可 2、实时背景虚化 虚化用安卓RenderScript实现 二、OCR扫码枪展示部分功能展示 实测 三、文档类端侧OCR解决方案 文档定位效果 文档定位+矫正+OCR
一、自己做的APP展示1、实时人像留色 融合时,将原图的灰度图设置为背景即可 2、实时背景虚化 虚化用安卓RenderScript实现 二、OCR扫码枪展示部分功能展示 实测 三、文档类端侧OCR解决方案 文档定位效果 文档定位+矫正+OCR
技术路线 数据采集->模型建立与调优->模型预测与误差补偿实验 相关论文发表 Qiang Lu, et al. “Comparison of pose error compensation for focal plane pose test platform using GRNN and CART.” Proc. of SPIE Vol. 10706.
概述这是2017上学期计算机视觉课程的project,识别带有字符倾斜和噪点的4字符验证码,已有训练集为6字符的验证码图片。 最终成果 思路1:传统方法可见,骨架细化后虽然速度差不多,但是精度下降很多。 传统方法结果分析与改进 思路2:CNNCNN结果与传统方法结果对比如下: 总结 此处SVM泛化能力更好,单个字符识别率96.7% CNN模型复杂反而起反作用,尝试Conv层间添加1×1降维和s
概述这是2017年4月份走在实验室楼道间萌生的一个想法,就想着能否做个识别每个实验室门牌号的检测器。 数据采集训练数据是自己在各个实验室门口拍的100多张图片,拍摄的时候会有不同的拍摄角度、光线亮暗的变化等; 如下图所示: 我的思路需要特别指出的是:在筛选字符的矩形时,采用了矩形框的统计特征,即选择矩形高的残差最小的3个。 详细的流程图如下所示: 中间结果门牌号数字区域分割结果图: 字符分
概述这是2016年大疆RoboMaster机器人竞赛的一个题目,当时在系里面的RoboMaster竞赛队伍中接触到的。 任务要求: 实时检测出视频中的所有九个区域,用矩形框将格子区域框出; 实时检测出视频中大符的目标区域和非目标区域,目标区域即为姿态形状一直发生变化的小人儿所在的格子区域,小人儿所在的格子每隔1.5秒换一次,所以检测速度尽量要快; 我的思路当然,可以用运动检测、运动跟踪的论文方
关键源代码-传统方法1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991