1、字节、字符、字符串
字节:计算机中的存储数据的单元,一个8 位的二进制数,一个很具体的数据空间
比如:‘0xCC’,‘0x45’,‘0xBA’在计算机中一般使用十六进制进行保存一些字符,颜色的保存等
字符:人们使用的记号,抽象意义上的一个符号,
比如:‘$’,‘#’,‘中’,‘2’等....
ANSI 字符串:在内存中,如果字符使用ANSI 编码形式存在,一个字符可能使用一个字节或多个字节来表示,
那么我们称这种字符串为ASII 字符串或者多字节字符串
比如: 一个中文占有两个字节: “我是obge” 占有8个字节
UNICODE字符串: 在内存中,如果“字符”是以在UNICODE 中的序号存在的,
那么称这种字符串为Unicode 字符串或者宽字节字符串
比如:一个中文占三个字节:"我是obge"占有10个字节
2、系统的发展
从计算机对多国语言的支持角度看,大致可以分为三个阶段
第一阶段:ASCII 计算机刚开始支持英语,其他语言不能够在计算机上存储和显示
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。
它主要用于显示现代英语,而其扩展版本EASCII则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。
ASCII 是这套编码系统的传统命名,ASCII是 IEEE里程碑 之一。IANA 现在更倾向于使用它的新名字 US-ASCII 。
比如:英文DOS
第二阶段:ANSI编码(本地化) 为了计算支持更多语言,通常使用0x80~0xFF 范围的 2 个字节来表示 1 个字符。
ANSI 美国国家标准学会(American National Standards Institute,ANSI)是负责制定美国国家标准的非营利组织。美国国家标准学会授权标准起草机构按照一系列规范编写标准草案。由此产生的候选文献通过ANSI审核批准后成为美国国家标准。美国国家标准学会是国际标准化组织和国际电工委员会的成员。
比如:中文DOS,中文windows 95/98 ,日文 Windows 95/98
不同国家和地区制定了不同的标准,由此产生了GB2312,BIG5,JIS等各自的编码标准。这些使用2个自己来代表一个字符的各种汉字延伸编码方式,称为ANSI 编码,