html语言

HTML总结

孤人 提交于 2020-04-03 06:54:16
几个知识点:   HTML 指的是超文本标记语言 (Hyper Text Markup Language) HTML框架结构: <!DOCTYPE html> <html> <head> </head> <body> 此处为标签内容 </body> </html> HTML属性: class=“XXX” :元素类名,CSS定位用 id=“XXX” :元素id,CSS定位用 style=“XXX”:定于元素颜色、是否居中、粗细、边界等 title=“XXX”:鼠标悬停时提示信息 Alt=“XXX”:图片加载错误提示信息 HTML常用标签: <h1 align=“center”>文字内容</h1>:标题居中显示 <p style="font-size:10px“>文字内容</p>:段落显示 <a href=“https://www.baidu.com/” title=“这是链接“>百度</a>:链接标签 <img src=“./picture.jpg” alt="图片加载错误"/>:图片显示标签 一些独立标签: <br/>:换行 <hr/>:创建水平线 <!– 注释内容-->:注释  显示空格(一种HTML实体符号) <div>此处可嵌套其他标签</div>:块级元素,他的内容会另起一行开始。 <span>此处可嵌套其他标签</span>:内联元素,不换行 无序列表: <ul> <li

DOCTYPE声明作用及用法详解

半腔热情 提交于 2020-04-03 04:19:59
一、浏览器呈现模式和doctype 有的网页是遵循标准而创作的,但也有很多不是。即使你不能创建遵循标准的网页,也希望浏览器根据标准来正确显示那些页。目前,大量网页充斥着大量非标准代码,它们仍能正常地工作。事实上,为旧版浏览器设计的大多数代码都能在新版浏览器中正确显示(虽然呈现方式可能有所区别)。这是什么原因呢?事实上,假如严格遵循最新标准,会完全破坏那些页的生存基础。对于任何希望有所作为的浏览器来说,这当然是令人无法接受的。 浏览器呈现模式 现代浏览器包括不同的呈现模式,目的是既支持遵循标准的网页,也支持为老式浏览器而设计的网页。其中, Standards (标准)模式(也就是严格呈现模式)用于呈现遵循最新标准的网页,而 Quirks (包容)模式(也就是松散呈现模式或者兼容模式)用于呈现为传统浏览器而设计的网页。另外,注意Mozilla/Netscape 6新增了一种 Almost Standards (近似标准)模式,用于支持为标准的某个老版本而设计的网页。 什么是 doctype切换? 放在网页顶部的doctype声明是让浏览器进入正确呈现模式的关键。浏览器自动切换到恰当的呈现模式,以便正确显示由doctype声明所指定的文档种类。 理论上,这应该是一个非常直观的切换。假如doctype指出当前网页是一个遵循标准(也就是HTML 4+或XHTML 1+)的文档

requests_html

|▌冷眼眸甩不掉的悲伤 提交于 2020-04-03 04:17:51
render方法 我们先理一下关系 requests 和的作者是同一个人, pyppeteer 是 nodejs 中 puppeteer 的非官方实现 requests-html 调用的 pyppeteer 与浏览器进行交互, puppeteer 的中文文档 点这里传送 pyppeteer 的文档 博文参考 调用render 方法启动 pyppeteer 使用之前要先下载 chromium 下载地址 你懂的,天朝网络环境很复杂,如果要用 pyppeteer 自己绑定的 chromium ,半天都下载不下来,所以我们要手动安装,然后在程序里面指定 executablePath 对于 requests-html 源代码在714行中加入 executablePath=’path/to/the/chromium‘ from requests_html import HTMLSession url = 'https://httpbin.org/get' session = HTMLSession() res = session.get(url = url) res.html.render() print(res.html.html) 可以看到如上图中我用红色的圈出来的地方,标示的是无头浏览器 HeadlessChrome ,这个是明显不是正常的人类用户,会被反扒网站所识别 url =

大厂在用的Python反爬虫手段,破了它!

只谈情不闲聊 提交于 2020-04-02 20:20:04
SVG 映射反爬虫 SVG 是用于描述二维矢量图形的一种图形格式。它基于 XML 描述图形,对图形进行放大或缩小操作都不会影响图形质量。矢量图形的这个特点使得它被广泛应用在 Web 网站中。 接下来我们要了解的反爬虫手段正是利用 SVG 实现的,这种反爬虫手段用矢量图形代替具体的文字,不会影响用户正常阅读,但爬虫程序却无法像读取文字那样获得 SVG 图形中的内容。由于 SVG 中的图形代表的也是一个个文字,所以在使用时必须在后端或前端将真实的文字与对应的 SVG 图形进行映射和替换,这种反爬虫手段被称为 SVG 映射反爬虫。 6.3.1 SVG 映射反爬虫绕过实战 示例 6:SVG 映射反爬虫示例。 网址: http://www.porters.vip/confusion/food.html 。 任务:爬取美食商家评价网站页面中的商家联系电话、店铺地址和评分数据,页面内容如图 6-15 所示。 图 6-15 示例 6 页面 在编写 Python 代码之前,我们需要确定目标数据的元素定位。在定位过程中,发现一个与以往不同的现象:有些数字在 HTML 代码中并不存在。例如口味的评分数据,其元素定位如图 6-16 所示。 图 6-16 评分数据中口味分数元素定位 根据页面显示内容,HTML 代码中应该是 8.7 才对,但实际上我们看到的却是: 1 < span class = "item

freemarker常见语法大全

笑着哭i 提交于 2020-04-01 22:37:05
FreeMarker的插值有如下两种类型:1,通用插值${expr};2,数字格式化插值:#{expr}或#{expr;format} ${book.name?if_exists } //用于判断如果存在,就输出这个值 ${book.name?default(‘xxx’)}//默认值xxx ${book.name!"xxx"}//默认值xxx ${book.date?string('yyyy-MM-dd')} //日期格式 ${book?string.number} 20 //三种不同的数字格式 ${book?string.currency}--<#-- $20.00 --> ${book?string.percent}—<#-- 20% --> <#assign foo=ture /> //声明变量,插入布尔值进行显示 ${foo?string("yes","no")} <#-- yes --> 大小比较符号使用需要注意:(xml的原因),可以用于比较数字和日期 使用lt、lte、gt和gte来替代<、<=、>和>= 也可以使用括号<#if (x>y)> 内置函数: 调用区别于属性的访问,使用?代替. 常见的一些内置函数 对于字符串 html-对字符串进行HTML编码 cap_first-使字符串第一个字母大写 lower_case-将字符串转换成小写 trim

HTML URL与HTML总结

ⅰ亾dé卋堺 提交于 2020-04-01 02:41:54
HTML URL代表HTML 统一资源定位器(Uniform Resource Locators),URL是一个网页地址,URL可以由字母组成,如"W3CSchools.cc",或互联网协议(IP)地址: 192.68.20.50;大多数人进入网站使用网站域名来访问,因为 名字比数字更容易记住。 URL - 统一资源定位器,Web浏览器通过URL从Web服务器请求页面;当您点击 HTML 页面中的某个链接时,对应的 <a> 标签指向万维网上的一个地址;一个统一资源定位器(URL) 用于定位万维网上的文档;一个网页地址实例:https://www.cnblogs.com/dhnblog/p/12556096.html 语法规则: 1 scheme://host.domain:port/path/filename scheme - 定义因特网服务的类型。最常见的类型是 http host - 定义域主机(http 的默认主机是 www) domain - 定义因特网域名,比如 cnblogs.com :port - 定义主机上的端口号(http 的默认端口号是 80) path - 定义服务器上的路径(如果省略,则文档必须位于网站的根目录中)。 filename - 定义文档/资源的名称 常见的 URL Schemes Scheme 访问 用于... http 超文本传输协议 以

使用DOM技术操纵文档

这一生的挚爱 提交于 2020-03-31 13:32:18
我们知道,如果使用DHTML对象模型对文档的内容进行操纵,就必须了解相关文档元素的特殊属性和方法。因为文档的元素有很多种,相应的属性和方法也就非常多,为了实现一个功能,开发人员不得不查询许多资料。但是有了DOM技术,一切变得简单起来,那些操纵文档内容的属性和方法具备了元素无关性(element-independent)特点,这使得我们能够按照相同的步骤操纵文档内容。毋庸置疑,DOM技术为开发人员在对象层次上操纵文档提供了最便捷的手段。 本文就为你全面介绍在JavaScript中如何使用DOM属性和方法操纵文档内容。 使用data、nodeValue和src属性 DOM提供了2个属性用于修改文本节点的内容,它们是data和nodeVaule。2个属性实现的功能相同,语法是:object.data="new value"或者object.nodeVaule="new value",其中object代表页面中的文本项节点。如果修改图形文件的内容,语法是:object.src="new value",其中object表示页面中的img标记节点。来看看下面的例子: <HTML><HEAD><TITLE> DOM Demo </title></HEAD> <BODY ID="bodyNode"> This is the document body <P ID = "p1Node">This

淘宝技术分享

↘锁芯ラ 提交于 2020-03-30 13:00:32
  前几天在淘宝UED( http://ued.taobao.com/blog/ )上看到了几篇不错的文章,且都有PPT,里面总结的很不错,因此分享给大家,主要针对的是初级前端开发者。这一系列课程由浅入深的介绍前端技术的关键部分,对HTML/CSS/JavaScript、包括浏览器渲染过程和JS引擎原理、常用工具等知识都有详细的讲解。 一、淘宝前端技术巡礼   这一讲主要介绍了淘宝前端的技术发展。   原文地址: 前端技术系列课程(No.1) – 淘宝前端技术巡礼   PPT如下:   PPT地址: http://www.slideshare.net/lijing00333/ss-12323405 二、HTML/CSS/JavaScript基础   这一讲有两部分,第一部分讲了HTML、CSS中关键知识,第二部分讲了ECMAScript基础   原文地址: http://ued.taobao.com/blog/2012/04/10/html-css-js/   HTML/CSS基础PPT:   PPT地址: http://www.slideshare.net/lijing00333/htmlcssjs   ECMAScript基础部分PPT:   PPT地址: http://www.slideshare.net/lijing00333/ecmascript 三、深入剖析浏览器  

JavaScript,Dom,jQuery

安稳与你 提交于 2020-03-30 05:21:05
JavaScript JavaScript是一门编程语言,浏览器内置了JavaScript语言的解释器,所以在浏览器上按照JavaScript 语言的规则编写相应代码,浏览器可以解释出相应的处理。 注:在编写代码时要养成一行代码以 “ ; ”(分号)结尾。因为在代码上线的时候,一般会对代码进行压缩,这时所有的JavaScript代码将被压缩为一行这时就需要以分号来识别一行代码的结束。 1,存在方式 文件方式 <script tyoe="text/javascript" src="JS文件"></script> 代码块 <script type="text/javascript"> JS代码 </script> 2,JavaScript 代码存在位置 HTML 的 head 中 HTML 的body代码块底部(推荐,因为HTML是从上到下解析的,放到上面如果代码出现问题无法解析,网站内容就无法正常的显示影响用户体验度) 3,变量 全局变量 局部变量 JavaScript中变量声明非常容易出错,局部变量必须以 var 开头,如果不加表示默认声明的是全局变量 name = "seven" # 全局变量 var name = "seven" # 局部变量 4,注释 // # 单行注释 /* */ # 多行注释 5,数据类型 数字(Number) var age = 18; var age

一丶HTML介绍

為{幸葍}努か 提交于 2020-03-30 02:17:02
import socket def main(): sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.bind(('localhost',8089)) sock.listen(5) while True: connection, address = sock.accept() buf = connection.recv(1024) connection.sendall(bytes("HTTP/1.1 201 OK\r\n\r\n","utf8")) connection.sendall(bytes("<h1>Hello,World</h1>","utf8")) connection.close() if __name__ == '__main__': main() html css 以及js的关系 HTML的学习 HTML 是什么? htyper text markup language 即 超文本标记语言 超文本: 就是指页面内可以包含图片、链接,甚至音乐、程序等非文字元素。 标记语言: 标记(标签)构成的语言. 网页==HTML文档,由浏览器解析,用来展示的 静态网页: 静态的资源,如xxx.html 动态网页: html代码是由某种开发语言根据用户请求动态生成的 html文档树形结构图: 什么是标签