字符集和编码知识
字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多 个字符的集合,字符集种类较多,每个字符集包含的字符个数 不同 ,常见字符集名称:ASCII 字符集、ISO 8859字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等 。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种 文字。 编码(Encoding)和字符集不同。字符集只是字符的集合,不一定适 合作 网络传送、处理,有时 须经编码(Encode)后才能应用。如Unicode可依不同需要以UTF-8、UTF-16、UTF-32等 方法 编码 。 因此,对字符进行编码,是信息交流的技术基础。本文将按照字符集的时间顺序讨论几种典型 的字符集,选取几种代表性的字符集,研究历史由来、特点、技术特征。 ASCII 字符集 1.名称的由来 ASCII(American Standard Code for Information Interchange,美国信息互换 标准 代码) 是基于罗马字母表的一套电脑编码系统。 2.特点 它主要用于显示现代 英语 和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际 标准ISO 646。 3.包含内容 控制字符:回车键、退格、换行键等。 可显示字符:英文大小写字符、阿拉伯数字和西文符号 4