网站验证码识别

耗尽温柔 提交于 2019-12-04 18:26:02

1.把网站验证码java流到本地

2.解析验证码图片本质是图片转文字过程,即OCR识别

3.本人使用的是asprise的ocr包,maven配置

<dependency>
            <groupId>com.asprise.ocr</groupId>
            <artifactId>java-ocr-api</artifactId>
            <version>15.3.0.3</version>
</dependency>

  

4.上述包只能简单识别位置摆正、无杂色的数字、字母。

5.对于有杂色的处理是去除杂色,这个前提是验证码的颜色单一,这样我用java的

java.awt.image

包的类去除与验证码不一致的即可。

6.对于未摆正,奇形怪状的字体则需要用插件包专门训练,训练后再去识别就可以了。就是说我你不会没关系,我教你,你会了就能识别了,如此简单道理

训练包可搜关键字

jTessBoxEditor

  

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!