字符编码

半腔热情 提交于 2019-12-02 02:11:46

ASCII码

标准ASCII码

标准ASCII码占1个字节,使用其中的低7位,最高位用作奇偶校验。

扩展ASCII码

 

GBK码

 

ISO码

 

Unicode码

UTF-8占1~4个字节,UTF-16占2、4个字节,UTF-32占4个字节。

UTF-8

1、UTF-8编码预先定义了一套编码与字符对应的集,每个字符的编码具有唯一性。

2、识别连续的UTF编码字节如何表示字符,先判断第一个字节,如果是以0开头,则这个字符是用一个字节表示。如果是1开头,连续n个1表示这个字符占n个字节,第一个字节以连续n个1和1个0开头,后续n-1个字节以10开头。

UTF-8字节流(二进制)
0xxxxxxx
110xxxxx 10xxxxxx
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

3、ASCII码是UTF-8的子集。

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!