编码规则

关于计算机编码的研究

℡╲_俬逩灬. 提交于 2019-11-27 19:23:17
说到编码,学计算机的肯定都知道ASCII,这是一套编码规则,即用7bit来表示128个字符(符号),可以认为就是我们键盘上的那些符号们,他的官方名称叫做:美国信息交换标准代码,是美国的! 他同时也可以认为是一套码值表,即比如x110 0001表示字符‘a’, 但是,英文没问题,日文,韩文,还有我们博大精深的中文咋办,于是就诞生了更多的编码规则 一,Unicode 这是一套码值表,他收集了世界上所有的符号系统,所有的,包括音节,神秘的符号等,只要给我一个字符,我一查表,就知道他对应的码点是多少? 但是那总不能就直接这么去查把,他总有一套规则规范哪些码点对应哪些字符,于是对应的编码方式有:UTF-16/UTF-32..... 具体怎么做的呢,或者说编码规则是什么呢? 1,概念简介 字符/符号/码点:'a','1‘......是字符/符号/码点;随便一个画一下就是符号/码点;用计算机的1010去编码一个符号,那么这一组01数字就是一个码点 Unicode/UTF-32/UCS-4...:Unicode是码值表,UTF-32等是编码规则,表示以怎样的规则生成码-值的对应关系 2,编码规则 为每一个符号分配一个码点,即一个rune类型的变量 1)UTF-8 这个规则是说,用一个变长的0101序列去作为一个码点来代表一个字符,即用1-4Byte来表示一个Unicode码点,具体说来如下 (1