在开始之前,先跟大家说一个挺有趣的事情,我在网上查资料的时候,无意中搜索到一个视频,视频的老师在开头讲了一段蛮有意思的话,他说,有好多的同学跟我反映说认真学习了基础教程,认真看了书并且都看懂了书里面的代码,但是等到自己写的时候还是编写不出,最后老师的结论是,因为这些人没有编程思想。作为一个同样也是自学的新手来说,这句话get到我的点了,简直不能再对
既然是模拟登录,那么现在先对自己提出问题,我最想知道的事情有什么
我最先想知道的是网站登录的流程是怎么样的
如果要是有时间,并且想真正了解网络基础的话,给大家推荐一本书《HTTP权威指南》
在这里我就结合网上查到的资料简单的给大家讲解一些
我们在爬虫基础知识那一小节里面已经简单的讲了浏览网页的过程,现在我们再来回顾一下
"在用户浏览网页的过程中,我们可能会看到许多好看的图片,比如http://image.baidu.com/,我们会看到几张的图片以及百度搜索框
这个过程其实就是用户输入网址之后,经过DNS服务器,找到服务器主机,向服务器发出一个请求,服务器经过解析之后,响应客户端的请求并且发送给用户的浏览器 HTML、JS、CSS 等文件,浏览器解析出来,用户便可以看到形形色色的图片了"
这里面重要的信息是客户端发送请求,服务器响应客户端的请求,我们通过浏览器的工具看看是不是这样,还是F12
我只是随便点了一个GET的数据来看的,我们可以看到有请求头信息也有响应头信息,这应该就是客户端和服务器之间的请求和响应,我们现在先不必了解这些数据有什么含义,我们只要知道有这么一回事就行了
那么,登陆网站的过程是怎样的呢?
首先我想,登陆的时候需要输入用户名和密码等等,然后浏览器应该通过某种方式将数据发送到服务器进行匹配,如果匹配成功的话服务器就会返回响应的数据,真实的流程是不是这样的呢?这个可以使用一些工具抓包来实现,但是这个后面再说
我们现在先来说说登录网站中的另外一种情况,cookies登陆
你有没有发现过这样一种现象,当你登陆一个网站之后的一段时间内,你第二次打开这个网站时发现不用再次输入账号密码你就已经自动登陆了,或者说当你在淘宝网搜索某些商品时,下次你再搜索的时候发现你上一次搜索的内容在候选框里,这就说明,有一个什么东西把我们的登陆信息或者是搜索的信息给保存起来了,然后下一次打开网站的时候,这个东西会自动帮我们登陆或者记录我们的搜索内容,这个东西就是cookies
来源:oschina
链接:https://my.oschina.net/u/2429887/blog/538035