口令破解之验证码识别技术探究
Posted 江南天安
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了口令破解之验证码识别技术探究相关的知识,希望对你有一定的参考价值。
本篇主要针对口令破解中的验证码识别技术的研究,主要分为云打码和本地打码。
原创工具已经很好用,主要调用了云验证码查询接口(需到官方购买),本次研究主要新增加一本地打码接口。
关于基准工具“小米范验证码登陆爆破工具”的介绍和使用方法可以参考原作者博客(http://www.cnblogs.com/SEC-fsq/p/5712792.html )。
原版界面如下所示:
新版界面如下:
与原版相比,有以下两个优点:
1.增加本地打码功能接口,可以自行添加验证码识别的方法。这样针对简单的验证码,不必使用云打码,使用自己的验证码识别功能即可。
2. 破解jxbrowser组件,重新整合代码,使得二次开发更方便。
Jxbrowser是Java浏览器一款组件,基于Chromium可以在java应用程序来处理和显示HTML5、CSS3、javascript、Flash等。jxbrowser是收费的,可以申请license来试用一个月。根据作者的工具不难看出,原来的做法是使用jxbrowser的demo,然后创建一个和demo目录结构一样的程序,来以此达到绕过license的限制达到破解的目的(具体可以参考http://www.freebuf.com/articles/web/41112.html)。工具的原理可以参考原作者博客。
源程序代码结构如下:
修改后的结构如下:
本地验证码识别可以调用YzmToText.getCode()方法来实现。
针对其他验证码的识别,修改getCode()方法即可。
1.tesseract-ocr下载安装
此步骤非必须,如果使用tess4j识别验证码的话需要安装该文件。本次验证码识别采用了tess4j,所以需要安装该文件。
如果识别验证码时提示如上错误,则需安装VC ++ 2015依赖库。
2.下载代码并打包jar文件(或者直接下载编译好的jar文件)。
打包的jar文件:https://github.com/fupinglee/CrackCaptcahLogin/releases
3.在jar同级目录下新建tmp目录(用来存放下载的验证码)、字典目录dict(username.txt和password.txt)、tessdata目录(训练识别验证码的库)。
其结构如下:
4.使用命令java -jar CrackCaptcahLogin.jar打开工具,输入url,根据id、name、class属性识别用户名、密码、验证码输入框、及登录按钮。
动态效果图如下所示:
1.验证码不同步
刚开始新增本地识别接口的时候,遇到有验证码不同步的情况。当时处理验证码是另外写了一个下载验证码的步骤,然后识别后提交,结果发现验证码一直不正确。以为是cookie的原因,就想着在获取验证码的同时将返回的cookie再置入浏览器,来达到同步的效果。结果还是不行。然后在使用云打码的时候发现验证码都是正确的,就看了一下验证码是怎样获取的。
结果发现多走了许多弯路,验证码数据内容已经返回了,直接将该数据流保存即可获取验证码图片。
2.本地验证码无法识别
由网站下载下来的验证码,直接使用tesseract可以识别,但是使用程序就无法识别了,即使设置了识别库也不行。然后发现经过处理后可以识别。如下:
这个识别验证码也不是万能的,无论识别简单的还是复杂的验证码还需要自己修改,不过只需修改YzmToText.java中的代码即可。这里只给出了一个示例而已。
原版可以去http://www.cnblogs.com/SEC-fsq/p/5712792.html 查看(再次强调),不管修改的还是原版的,功能可能还不完善,代码已放在GitHub,可以自行修改。简单的我已经完成了,困难的交给你们。
来源:猎户安全实验室
以上是关于口令破解之验证码识别技术探究的主要内容,如果未能解决你的问题,请参考以下文章