图像识别练习(flash验证码)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像识别练习(flash验证码)相关的知识,希望对你有一定的参考价值。

野比 2012

由于破解可能给他人带来困扰,所以我只说大概的思路,不会提供源码。

-----------------

本次目标是www.iboling.com的flash验证码。

这个网站很新颖,用的是flash动画,随机给出大小球,然后让用户用鼠标点击相应的球,实现验证码输入。像这样

技术分享

本来这是个很不错的思路,跳出了「干扰线」「扭曲字」等验证码的思维定势。但方式新颖并不代表能高枕无忧。

因为复杂度不够,所以反而容易破解。

有几个缺点:

1.颜色单一(很好识别)

2.下方候选球滚动缓慢(足够程序识别完再点击)

3.鼠标悬停(哪怕机器慢,只要控制鼠标悬停,就可以让候选球停止滚动)

4.不能加快速度或取消悬停(因为这样「人」就没法选了)

破解思路:

1.找到网页中验证码位置和大小(很容易)

2.截图采样(验证码图片和候选球图片)

3.分别从图像中提取全部色块及其对应的Rectangle(大约25x25),存入big和small

4.遍历对比候选球和验证码,颜色近似则可认为匹配

5.根据候选球的Rectangle,加上第2步里截图的offset,计算候选球在屏幕上的绝对位置

6.编程或用按键精灵在候选球上click一下

7.每次处理一个球,然后等等,给flash一个反应时间。

下面是破解样本(数字不准,因为有废弃识别被程序过滤掉了)

技术分享

技术分享

技术分享

技术分享

关于速度

速度的问题大家会很关心,但我可以说速度不是问题。

首先,因为候选区是鼠标悬停的。所以哪怕我机器再烂再慢,我可以先悬停,让它停止滚动,然后再慢慢「一百遍一百遍」。

其次,就算一直滚动,但因为要让人点击,所以不可能滚动太快。在我的i3机器上,没有优化的识别速度大约10fps,优化过后识别率提升到40~50fps,远远超过人的反应速度。也就说这个验证码只要人能点,机器就可以点。

改进意见

1.使用带图案,带纹理的小球

2.随机改变小球形状

3.验证码和候选球不需要完全一样,只需要人能看懂「相似」就行(比如验证码是数字「贰」,候选球是阿拉伯「2」),这样机器基本不太可能识别

4.增加背景复杂度,比如图片背景

暂时想到这么多,欢迎各位朋友一起探讨。

野比 2012


以上是关于图像识别练习(flash验证码)的主要内容,如果未能解决你的问题,请参考以下文章

81 数字验证码识别实例

python 简单图像识别--验证码Ⅲ

[图像]验证码图片内容识别(付费参加)

python 简单图像识别--验证码

82 数字验证码识别实例

利用Python进行简单的图像识别(验证码)