python坚持到底05
今天主要介绍Python字符编码,其实字符编码不单适用于Python,对于计算机语言都适用,可以当做常识了解一下。 以下内容来自网络,我进行了部分编排。 完全理解字符编码 与 Python 的渊源前,我们有必要把一些基础概念弄清楚,虽然有些概念我们每天都在接触甚至在使用它,但并不一定真正理解它。比如:字节、字符、字符集、字符码、字符编码。 1、字节 字节(Byte)是计算机中数据存储的 基本单元 ,一字节等于一个8位的比特,计算机中的所有数据,不论是保存在磁盘文件上的还是网络上传输的数据(文字、图片、视频、音频文件)都是由字节组成的。 2、字符 你正在阅读的这篇文章就是由很多个字符(Character)构成的,字符一个信息单位, 它是各种文字和符号的统称 ,比如一个英文字母是一个字符,一个汉字是一个字符,一个标点符号也是一个字符。 3、字符集 字符集(Character Set)就是某个范围内字符的集合, 不同的字符集规定了字符的个数 ,比如 ASCII 字符集总共有128个字符,包含了英文字母、阿拉伯数字、标点符号和控制符。而 GB2312 字符集定义了7445个字符,包含了绝大部分汉字字符。 4、字符码 字符码(Code Point)指的是字符集中每个字符的数字编号,例如 ASCII 字符集用 0-127 连续的128个数字分别表示128个字符,例如 "A"