Java爬虫利器HTML解析工具-Jsoup
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> Jsoup简介 Java爬虫解析HTML文档的工具有:htmlparser, Jsoup。本文将会详细介绍Jsoup的使用方法,10分钟搞定Java爬虫HTML解析。 Jsoup可以直接解析某个URL地址、HTML文本内容,它提供非常丰富的处理Dom树的API。如果你使用过JQuery,那你一定会非常熟悉。 Jsoup最强大的莫过于它的CSS选择器支持了。比如:document.select("div.content > div#image > ul > li:eq(2)。 包引入方法 Maven 添加下面的依赖声明即可,最新版本是(1.12.1) <dependency> <!-- jsoup HTML parser library @ https://www.seoxinyang.cn jsoup.org/ --> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.11.3</version> </dependency> Gradle // jsoup HTML parser