HtmlAgilityPack

C# 爬虫

ぐ巨炮叔叔 提交于 2021-02-10 07:38:29
//PS 需要引用HtmlAgilityPack.dll 文件,可自行在网上下载 public partial class GrabInterface : Form { public int number = 1; public GrabInterface() { InitializeComponent(); this.Load += GrabInterface_Load; } //定时器 System.Timers.Timer myTimer; //定义委托,防止两线程之间控件赋值冲突 public delegate void Action<in T>(T obj); public void ActionRead(int t) { this.lbl_ok.Text = "正在读取中,请稍后..."; this.btn_sure.Enabled = false; } public void ActionFinall(int t) { this.lbl_ok.Text = "读取完毕"; this.btn_sure.Enabled = false; } public static bool result = true;//设置定时器点击按钮时执行,避免重复执行定时器导致时间混乱 private void btn_sure_Click(object sender, EventArgs

因为我最近忙、所以我写了它

人走茶凉 提交于 2020-08-10 00:55:06
一、事出有因 1、上周工作原因项目的事情每天都很忙,周五下班和乐师兄下班的时候已经晚上11点了,然后和师兄吃了一个烧烤吃到了12点了(结果啥也没吃,钱也花了挺多的。ps:程序员建议养生)扯远了 ,主要是一周比较忙周六没有进行我们学校的健康报备信息填写。导致辅导员给我打了6个电话(现在我还是在实习中,所以还归学校管)自己刚好在看网络请求这一块的东西,说干就干!!! 二、知其所以然 1、我们学校的健康报备主要是将自己每天的信息填写到学校的公众号上面。打开页面是这样的。这个时候我们就要想一下我们是要做什么了。首先我们健康报备的流程是=>打开学校公众号=>输入自己的学号点击查询=>然后输入自己的正式情况=>点击提交。 三、反向分析 1、做为程序员的我们首先要清楚我们要什么,现在我们已经清楚了要做什么了和步骤。现在就是用我们的程序模拟用户进行正常的报备工作。首先我将报备链接从学校公众号复制出来,然后使用浏览器访问查看我们在进行报备的时候我们向浏览器发起了什么和做了什么。 2、在左边的是我们的页面,右边的是网页请求的文件和信息,我们就一步一步的进行分析。这里我们可以看到我们在访问页面的时候会生成一些信息_ _EVENTVALIDATION 、 __VIEWSTATEGENERATOR 我以前在长沙写的也是ASPX页面使用控件程序的时候也会生成一些这个

因为我最近忙、所以我写了它

守給你的承諾、 提交于 2020-08-09 05:59:21
一、事出有因 1、上周工作原因项目的事情每天都很忙,周五下班和乐师兄下班的时候已经晚上11点了,然后和师兄吃了一个烧烤吃到了12点了(结果啥也没吃,钱也花了挺多的。ps:程序员建议养生)扯远了 ,主要是一周比较忙周六没有进行我们学校的健康报备信息填写。导致辅导员给我打了6个电话(现在我还是在实习中,所以还归学校管)自己刚好在看网络请求这一块的东西,说干就干!!! 二、知其所以然 1、我们学校的健康报备主要是将自己每天的信息填写到学校的公众号上面。打开页面是这样的。这个时候我们就要想一下我们是要做什么了。首先我们健康报备的流程是=>打开学校公众号=>输入自己的学号点击查询=>然后输入自己的正式情况=>点击提交。 三、反向分析 1、做为程序员的我们首先要清楚我们要什么,现在我们已经清楚了要做什么了和步骤。现在就是用我们的程序模拟用户进行正常的报备工作。首先我将报备链接从学校公众号复制出来,然后使用浏览器访问查看我们在进行报备的时候我们向浏览器发起了什么和做了什么。 2、在左边的是我们的页面,右边的是网页请求的文件和信息,我们就一步一步的进行分析。这里我们可以看到我们在访问页面的时候会生成一些信息_ _EVENTVALIDATION 、 __VIEWSTATEGENERATOR 我以前在长沙写的也是ASPX页面使用控件程序的时候也会生成一些这个

如何使用HTML Agility Pack

风流意气都作罢 提交于 2020-01-07 01:28:40
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 如何使用 HTML Agility Pack ? 我的XHTML文档不是完全有效。 这就是为什么我要使用它。 如何在项目中使用它? 我的项目在C#中。 #1楼 HtmlAgilityPack使用XPath语法,尽管许多人认为它的文档记录不充分,但在以下XPath文档的帮助下使用它时,我没有遇到麻烦: https : //www.w3schools.com/xml/xpath_syntax.asp 解析 <h2> <a href="">Jack</a> </h2> <ul> <li class="tel"> <a href="">81 75 53 60</a> </li> </ul> <h2> <a href="">Roy</a> </h2> <ul> <li class="tel"> <a href="">44 52 16 87</a> </li> </ul> 我这样做: string url = "http://website.com"; var Webget = new HtmlWeb(); var doc = Webget.Load(url); foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//h2//a")) { names.Add