计算机基础 ------ 数据编码

别来无恙 提交于 2019-12-04 07:13:40

1、字节、字符、字符串

字节:计算机中的存储数据的单元,一个8 位的二进制数,一个很具体的数据空间

  比如:‘0xCC’,‘0x45’,‘0xBA’在计算机中一般使用十六进制进行保存一些字符,颜色的保存等

字符:人们使用的记号,抽象意义上的一个符号,

  比如:‘$’,‘#’,‘中’,‘2’等....

ANSI 字符串:在内存中,如果字符使用ANSI 编码形式存在,一个字符可能使用一个字节或多个字节来表示,

     那么我们称这种字符串为ASII 字符串或者多字节字符串

  比如: 一个中文占有两个字节:  “我是obge” 占有8个字节

UNICODE字符串: 在内存中,如果“字符”是以在UNICODE 中的序号存在的,

     那么称这种字符串为Unicode 字符串或者宽字节字符串

  比如:一个中文占三个字节:"我是obge"占有10个字节

 

2、系统的发展

从计算机对多国语言的支持角度看,大致可以分为三个阶段

第一阶段:ASCII    计算机刚开始支持英语,其他语言不能够在计算机上存储和显示  

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。

  它主要用于显示现代英语,而其扩展版本EASCII则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。

  ASCII 是这套编码系统的传统命名,ASCII是 IEEE里程碑 之一。IANA 现在更倾向于使用它的新名字 US-ASCII 。

比如:英文DOS

第二阶段:ANSI编码(本地化)  为了计算支持更多语言,通常使用0x80~0xFF 范围的 2 个字节来表示 1 个字符。

  ANSI   美国国家标准学会(American National Standards Institute,ANSI)是负责制定美国国家标准的非营利组织。美国国家标准学会授权标准起草机构按照一系列规范编写标准草案。由此产生的候选文献通过ANSI审核批准后成为美国国家标准。美国国家标准学会是国际标准化组织和国际电工委员会的成员。

比如:中文DOS,中文windows 95/98 ,日文 Windows 95/98

   不同国家和地区制定了不同的标准,由此产生了GB2312,BIG5,JIS等各自的编码标准。这些使用2个自己来代表一个字符的各种汉字延伸编码方式,称为ANSI 编码,

 

 

 

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!