使用深度学习模型识别12306图片验证码

Posted 听风吟且行

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用深度学习模型识别12306图片验证码相关的知识,希望对你有一定的参考价值。



识别12306图片验证码
缘起
       最近在写12306抢票软件,发现图片验证码绕不过,开始用手动输入图片验证码的方式去登录12306账户,不过幸好,只有登录的时候需要验证图片,下单的时候不需要图片验证码识别,成功购票!

      但是,怎么能这么轻易的放过图片验证码呢?这里,学以致用,如何使用深度学习去识别12306图片验证码呢?

Jan 2019

分析

12306的图片验证码是从8个图片中找到要求的物体,如下图所示:

使用深度学习模型识别12306图片验证码

统计了1000个左右的样本图片,发现12306的图片类别只有80个,如下列表:

药片 中国结 仪表盘 公交卡 冰箱 创可贴 刺绣 剪纸
印章 卷尺 双面胶 口哨 啤酒 安全帽 开瓶器 手掌印
打字机 护腕 拖把 挂钟 排风机 文具盒 日历 本子
档案袋 棉棒 樱桃 毛线 沙包 沙拉 海报 海苔
海鸥 漏斗 烛台 热水袋 牌坊 狮子 珊瑚 电子秤
电线 电饭煲 盘子 篮球 红枣 红豆 红酒 绿豆
网球拍 老虎 耳塞 航母 苍蝇拍 茶几 茶盅 菠萝
蒸笼 薯条 蚂蚁 蜜蜂 蜡烛 蜥蜴 订书机 话梅
调色板 跑步机 路灯 辣椒酱 金字塔 钟表 铃铛 锅铲
锦旗 雨靴 鞭炮 风铃 高压锅 黑板 龙舟

       通过一轮又一轮的训练12306的验证码图片,生成了识别模型。关于具体的模型训练,此处省略一亿字。

      由于是小白,这里图片的识别不是很高,没有达到100%,测试总体的准确率在75% - 85% 之间,还有完善的空间。

        这里,在本地搭建了个临时访问的web网站,可以体验体验图片的识别。


  请用电脑浏览器打开 http://idl.free.idcfengye.com/



演示
打开上面的演示地址:http://idl.free.idcfengye.com/

使用深度学习模型识别12306图片验证码

演示的图片验证码文件:

上传文件之后,跳到显示识别出来的结果的页面:

成功识别出来,OK,最后有个问题,最近一直在思考:Deep Learning 真的是泡沫吗?



以上是关于使用深度学习模型识别12306图片验证码的主要内容,如果未能解决你的问题,请参考以下文章

12306 售票网站新版验证码识别对抗

使用selenium 和图片验证码识别 对12306的模拟登录+12306查询车次

12306模拟登陆-超级鹰

12306购票处理验证码并完成登陆

深度学习基于卷积神经网络的验证码识别

图像学习-验证码识别