1.把网站验证码java流到本地
2.解析验证码图片本质是图片转文字过程,即OCR识别
3.本人使用的是asprise的ocr包,maven配置
<dependency> <groupId>com.asprise.ocr</groupId> <artifactId>java-ocr-api</artifactId> <version>15.3.0.3</version> </dependency>
4.上述包只能简单识别位置摆正、无杂色的数字、字母。
5.对于有杂色的处理是去除杂色,这个前提是验证码的颜色单一,这样我用java的
java.awt.image
包的类去除与验证码不一致的即可。
6.对于未摆正,奇形怪状的字体则需要用插件包专门训练,训练后再去识别就可以了。就是说我你不会没关系,我教你,你会了就能识别了,如此简单道理
训练包可搜关键字
jTessBoxEditor